


- durbinWatsonTest() : 독립성 검정
- vif() : 다중공선성 체크
- influencePlot() : 이상치 검정 → cook's D 값이 높으면 문제 및 제거
- 이상치 제거는 df = df[-c(121), ]


- AIC : AIC 값이 줄어들면 그 변수는 의미가 있다.








- F-통계량 : F-통계량이 클수록 회귀 모델이 데이터에 더 적합함을 나타낸다. → 모델의 적합도
- F-통계량은 회귀 분석에서 모형의 유의성을 평가하는 지표이다. 실제로는 MSR/MSE의 비율로 계산
- 이를 통해 회귀 모형이 통계적으로 유의미한지, 즉 독립 변수들이 종속 변수를 설명하는 데 유의미한 기여를 하는지를 판단이 가능하다.
- F-통계량 = MSR/MSE, MSR은 모델이 설명하는 변동을 나타내고 MSE는 잔차의 변동, 즉 모델이 설명하지 못하는 변동을 나타낸다.


회귀분석 전에는 독립성과 다중공선성을 판단해야하지만, 회귀분석 후에는, 정규성, F-통계량, p-value, RMSE, R-Squared, 다중공선성 판단을 해야한다.
'머신러닝2 > 수업 필기' 카테고리의 다른 글
머신러닝2 7주차 (1) (0) | 2024.10.23 |
---|---|
머신러닝2 5주차 (0) | 2024.10.23 |
머신러닝2 4주차(1) (3주차는 추석일정으로 휴강) (0) | 2024.10.22 |
머신러닝2 2주차 (2) | 2024.10.22 |
머신러닝2 1주차 (1) | 2024.10.22 |