머신러닝을 위한 통계학1/R언어 실습

통계학 R언어 실습 (7)

코딩입문시작 2024. 4. 19. 16:07

결합확률  :  확률변수가 2개 인 경우에 정의되는 확률이고, 확률변수가 취할 수 있는 모든 경우에 대한 빈도, 또는 이것으로부터 동일하게 확률로 변환하면 된다. 빈도로 표현하거나 확률로 동일하게 표현하면 된다.

 

한계확률 : 변수가 2개인 상황에서 한 개만을 확률변수로 취급하는 것

조건부 확률 : 여전히 2개가 확률변수이다.

 

문제에서, 불량 제품이라는 조건 하에서 대전에서 생산된 제품일 확률을 구하시오. 가 나오면

  • P(불량) = P(대전∩불량) + P(광주∩불량) + P(대구∩불량) = 0.053
  • P(대전|불량) = P(대전∩불량) * P(불량) = 0.035 / 0.053 = 0.6603

각각 구분 할 줄 알아야 한다. 

무조건 출제되므로 확인하기

  • 독립은 복원추출이다, 영향을 주지 않는다. 이항분포
  • 종속은 비복원추출이다, 영향을 준다. 초기하분포

복원추출이 확인되면, 이항분포 (dbinom) 을 사용한다. 

비복원 추출일 경우, 초기하분포 (dhyper) 을 사용한다. 

dhyper(x, m, n, k) 에 대해

  • x : 표본에서 관심있는 사건이 일어난 횟수 ex) 위 문제처럼, 세 번째 마지막 불량품이 발견될 확률
  • m : 모집단에서의 총 성공 횟수 ex) 불량품 개수
  • n : 모집단에서의 실패 횟수 ex) 정상품 개수
  • k : 표본의 수 ex) 제품을 검사하는 횟수

 

  • 이항 분포 : 독립적인 시행을 여러 번 수행하여 얻은 성공의 분포
  • 초기하 분포 : 비복원 추출에서의 성공의 분포

[ 고난이도 문제, 출제될 가능성 높음 (조건부확률&베이즈정리) ]

답 : ( P(B|A)*P(A) / (P(B|A) * P(A) + P(B|A x) * P(A x))

= 암에걸렸을 때 양성받을 확률 * 암에 걸릴 확률 / (암에 걸렸을때 양성받을 확률 * 암에 걸릴 확률 + 암에 걸리지 않았을 때 양성받을 확률 * 암에 걸리지 않을 확률)
분모 : 암에 걸렸든 안걸렸든 양성에 걸리는 확률

표를 그리면서 문제를 풀자!

 


[ 시험 전, 문제 풀이 하자. 헷갈렸던 문제 ]