결합확률 : 확률변수가 2개 인 경우에 정의되는 확률이고, 확률변수가 취할 수 있는 모든 경우에 대한 빈도, 또는 이것으로부터 동일하게 확률로 변환하면 된다. 빈도로 표현하거나 확률로 동일하게 표현하면 된다.
한계확률 : 변수가 2개인 상황에서 한 개만을 확률변수로 취급하는 것
조건부 확률 : 여전히 2개가 확률변수이다.
문제에서, 불량 제품이라는 조건 하에서 대전에서 생산된 제품일 확률을 구하시오. 가 나오면
- P(불량) = P(대전∩불량) + P(광주∩불량) + P(대구∩불량) = 0.053
- P(대전|불량) = P(대전∩불량) * P(불량) = 0.035 / 0.053 = 0.6603
각각 구분 할 줄 알아야 한다.
- 독립은 복원추출이다, 영향을 주지 않는다. 이항분포
- 종속은 비복원추출이다, 영향을 준다. 초기하분포
복원추출이 확인되면, 이항분포 (dbinom) 을 사용한다.
비복원 추출일 경우, 초기하분포 (dhyper) 을 사용한다.
dhyper(x, m, n, k) 에 대해
- x : 표본에서 관심있는 사건이 일어난 횟수 ex) 위 문제처럼, 세 번째 마지막 불량품이 발견될 확률
- m : 모집단에서의 총 성공 횟수 ex) 불량품 개수
- n : 모집단에서의 실패 횟수 ex) 정상품 개수
- k : 표본의 수 ex) 제품을 검사하는 횟수
- 이항 분포 : 독립적인 시행을 여러 번 수행하여 얻은 성공의 분포
- 초기하 분포 : 비복원 추출에서의 성공의 분포
[ 고난이도 문제, 출제될 가능성 높음 (조건부확률&베이즈정리) ]
답 : ( P(B|A)*P(A) / (P(B|A) * P(A) + P(B|A x) * P(A x))
= 암에걸렸을 때 양성받을 확률 * 암에 걸릴 확률 / (암에 걸렸을때 양성받을 확률 * 암에 걸릴 확률 + 암에 걸리지 않았을 때 양성받을 확률 * 암에 걸리지 않을 확률)
분모 : 암에 걸렸든 안걸렸든 양성에 걸리는 확률
[ 시험 전, 문제 풀이 하자. 헷갈렸던 문제 ]
'머신러닝을 위한 통계학1 > R언어 실습' 카테고리의 다른 글
통계학 R언어 [도수분포표 그리는 방법 (참고)] (0) | 2024.04.21 |
---|---|
통계학 R언어 실습 (6) (1) | 2024.04.19 |
통계학 R언어 실습 (5) (1) | 2024.04.18 |
통계학 R언어 실습 (4) (1) | 2024.04.18 |
통계학 R언어 실습 (3) (1) | 2024.04.18 |