최빈값
table() 함수로 빈도를 산출한 후, 빈도가 가장 많은 Factor를 반환하도록 한다.
value ← table(data1)
mode ← as.numeric(names(value[value == max(value)]))
mode
R에는 4가지 정규분포와 관련된 함수가 내장되어 있다.
- 난수 함수 rnorm
- 확률밀도함수 dnorm
- 누적분포함수 pnorm
- 분위수함수 qnorm
난수함수
- 정규분포함수의 변수에 해당하는 값을 임의로 생성해주는 함수이다.
- 디폴트(기본셋팅)은 ‘표준정규분포’이고, 평균과 표준편차를 설정해줄 수 있다.
확률밀도함수
- 확률밀도함수는 확률밀도함수의 함수값을 구해줍니다. 확률밀도함수 이기 때문에 값 자체가 확률을 의미하지는 않습니다.
- 디폴트 평균이 0이므로 최대값은 0에서 발생한다.
- 표준편차가 커지면 최대값은 작아진다.
누적분포함수
- pnorm(1) 는 그래프의 색칠한 부분의 넓이를 의미한다.
- 색칠하지 않은 쪽의 넓이를 구하려면 lower.tail=False를 추가해야한다.
분위수함수
- 누적분포함수의 역함수라고 생각하면 된다.
- 확률이 입력변수이고, 어떤 확률을 입력하면 그 확률에 해당하는 변수값을 찾아준다.
'머신러닝을 위한 통계학1 > R언어 실습' 카테고리의 다른 글
통계학 R언어 실습 (6) (1) | 2024.04.19 |
---|---|
통계학 R언어 실습 (5) (1) | 2024.04.18 |
통계학 R언어 실습 (3) (1) | 2024.04.18 |
통계학 R언어 실습 (2) (0) | 2024.04.17 |
통계학 R언어 실습 (1) (0) | 2024.04.17 |