머신러닝을 위한 통계학1/R언어 실습

통계학 R언어 실습 (4)

코딩입문시작 2024. 4. 18. 23:03

산점도 유력 문제

 

척도 관련 유력 문제

최빈값
table() 함수로 빈도를 산출한 후, 빈도가 가장 많은 Factor를 반환하도록 한다.

value ← table(data1)
mode ← as.numeric(names(value[value == max(value)]))
mode

 

R에는 4가지 정규분포와 관련된 함수가 내장되어 있다. 

  • 난수 함수 rnorm 
  • 확률밀도함수 dnorm
  • 누적분포함수 pnorm
  • 분위수함수 qnorm

난수함수

  • 정규분포함수의 변수에 해당하는 값을 임의로 생성해주는 함수이다.
  • 디폴트(기본셋팅)은 ‘표준정규분포’이고, 평균과 표준편차를 설정해줄 수 있다.

확률밀도함수

  • 확률밀도함수는 확률밀도함수의 함수값을 구해줍니다. 확률밀도함수 이기 때문에 값 자체가 확률을 의미하지는 않습니다.
  • 디폴트 평균이 0이므로 최대값은 0에서 발생한다.
  • 표준편차가 커지면 최대값은 작아진다.

누적분포함수

  • pnorm(1) 는 그래프의 색칠한 부분의 넓이를 의미한다.
  • 색칠하지 않은 쪽의 넓이를 구하려면 lower.tail=False를 추가해야한다. 

분위수함수

  • 누적분포함수의 역함수라고 생각하면 된다.
  • 확률이 입력변수이고, 어떤 확률을 입력하면 그 확률에 해당하는 변수값을 찾아준다.

예상 문제


 

'머신러닝을 위한 통계학1 > R언어 실습' 카테고리의 다른 글

통계학 R언어 실습 (6)  (1) 2024.04.19
통계학 R언어 실습 (5)  (1) 2024.04.18
통계학 R언어 실습 (3)  (1) 2024.04.18
통계학 R언어 실습 (2)  (0) 2024.04.17
통계학 R언어 실습 (1)  (0) 2024.04.17