머신러닝2/수업 필기

머신러닝2 4주차(2)

코딩입문시작 2024. 10. 23. 00:29

수업때 다루지 않음.
이런 함수들이 있다는 건 알고 가야 한다.

  • durbinWatsonTest() : 독립성 검정
  • vif() : 다중공선성 체크
  • influencePlot() : 이상치 검정 → cook's D 값이 높으면 문제 및 제거
  • 이상치 제거는 df = df[-c(121), ] 

  • AIC : AIC 값이 줄어들면 그 변수는 의미가 있다.

  • F-통계량 : F-통계량이 클수록 회귀 모델이 데이터에 더 적합함을 나타낸다. → 모델의 적합도
  • F-통계량은 회귀 분석에서 모형의 유의성을 평가하는 지표이다. 실제로는 MSR/MSE의 비율로 계산
  • 이를 통해 회귀 모형이 통계적으로 유의미한지, 즉 독립 변수들이 종속 변수를 설명하는 데 유의미한 기여를 하는지를 판단이 가능하다.
  • F-통계량 = MSR/MSE, MSR은 모델이 설명하는 변동을 나타내고 MSE는 잔차의 변동, 즉 모델이 설명하지 못하는 변동을 나타낸다.

회귀분석 전에는 독립성과 다중공선성을 판단해야하지만, 회귀분석 후에는, 정규성, F-통계량, p-value, RMSE, R-Squared, 다중공선성 판단을 해야한다.

 

'머신러닝2 > 수업 필기' 카테고리의 다른 글

머신러닝2 7주차 (1)  (0) 2024.10.23
머신러닝2 5주차  (0) 2024.10.23
머신러닝2 4주차(1) (3주차는 추석일정으로 휴강)  (0) 2024.10.22
머신러닝2 2주차  (2) 2024.10.22
머신러닝2 1주차  (1) 2024.10.22