머신러닝을 위한 통계학1/R언어 실습

통계학 R언어 실습 (6)

코딩입문시작 2024. 4. 19. 14:26

표본공간과 사상

 

표본공간 : 확률실험을 실시하여 나타낼 수 있는 모든 결과의 집합

  • 예시 : 주사위 한 개를 던지는 확률 실험에서의 표본공간은 S = {1, 2, 3, 4, 5, 6}

사상 : 표본공간을 구성하고 있는 원소 중에서 관심의 대상이 되는 원소들의 집합 (표본공간의 부분집합)

  • 예시 : 주사위를 던지는 실험에서 “홀수가 나오는 사상”을 A 라고 하면 A = {1, 3, 5}

조건부 확률

 

확률 : 어떤 사상이 발생할 수 있는 가능성을 수치로 나타낸 것

조건부 확률 : 어떤 사상 B가 발생했다는 조건 하에서 또 다른 사상 A가 발생할 확률

  • P(B|A) : 사건 A가 일어났을 때 B가 일어날 확률
  • P(A∩B) :  A와 B가 동시에 일어날 확률
expand.grid( ) : 주어진 벡터들로부터 가능한 모든 조합을 생성
nrow( ) : dataframe의 행의 수를 출력하는 함수
apply( ) : 행렬이나 배열에 조건을 적용시킬 때 사용하는 함수
▶ apply(함수, 1 또는 2, 적용할 함수)
subset( ) : 조건에 맞는 요소나 벡터 출력하는 함수
intersect( ) : 두 개의 벡터에서 공통된 요소를 출력 (A∩B)

▶ 교사상은 intersect() 함수를 이용해서 구할 수도 있다.

 

독립사상 

  • 사건 A와 사건 B가 서로에게 아무런 영향을 주지 않는다.
  • 사상 B가 A에 영향을 주지 않으면 P(A|B) = P(A)
  • 이 때 두 사상 A와 B는 서로 독립이라 한다.
  • P(A) x P(F) = 0.18 ≠ P(A∩F)
  • P(A∩B) = P(A)P(B) 가 성립하지 않으므로 독립사상이 아니다.

베이즈 정리

  • 특정 사상 A가 관측되기 이전의 확률로부터 사상 A가 관측된 후의 조건부 확률을 구하기 위한 것
  • 특정 사상 A가 관측되기 이전의 확률 P(B)는 사전확률
  • 사상 A가 관측된 후의 조건부 확률 P(A|B)는 사후확률
  • P(B|A): B가 발생했다는 조건 하에서 A의 확률 (우도, likelihood)
  • P(B): 사건 B의 사전 확률, 어떤 사건이 발생하기 전에 이미 알고 있는 확률 (evidence)

 

 

[ 시험 출제 가능성 ]

※ 베이즈 정리로 구한 사후확률의 합은 1이 된다! 

+ 사상 A와 D의 사후 확률은 늘어났지만, 사상 B와 C의 사후확률은 줄어들었다. 이는 생산라인 A와 D의 불량률이 상대적으로 높았고, 생산라인 B와 C의 불량률은 상대적으로 낮았기 때문이다.