머신러닝2/수업 필기

머신러닝2 10주차

코딩입문시작 2024. 12. 11. 00:03

▶ 이번 시간에는, 지도 학습 중에서 기계학습의 회귀분석을 다뤄볼 예정이다.

회귀분석으로는, 크게 2가지로 나뉠 수 있다.

  • 다중 회귀분석 (Regression) → 종속변수가 연속형이며, 예측을 목적으로 수행한다.
  • 로지스틱 회귀분석 (Logistic Regression)종속변수가 범주형이며, 분류를 목적으로 수행한다.

  • 로지스틱 회귀분석: 로지스틱 회귀 모델은 시그모이드 함수라고도 알려진 로지스틱 함수를 사용하여 예측값을 확률에 매핑해 0과 1로 도출한다.

※ 코드는 뒤에 실습때 할 예정이다.

모델 검정 [시험출제 가능성!! + 개념과 각각 구하는 방법을 알아야 한다.]

  • 종속변수가 수치형인 모델에서는 RMSE 값이나 R-Squared (설명력) 값을 통해 검정을 하지만, 범주형인 모델에서는 Accuracy(정확도)와 ROC Curve를 통해 검정을 한다.
  • 정확도: 전체 예측 정답 중 얼마나 올바르게 예측했는가에 대한 비율
  • 정밀도: 모든 긍정적인 예측 중 실제 긍정적인 예측의 비율
  • 재현율: 모든 실제 양성 사례 중 참양성 예측의 비율
  • F1 Score: 정밀도와 재현율의 조화 평균이다. → Label의 성능이 불균형일 경우 정확하게 평가할 수 있다.

중요시 보자!!

ROC Curve - 모델 검정

  • ROC 값은 분류가 좋은지 아닌지에 대한 기준이 된다. 
  • TPR (Y축) : 실제 클래스 TRUE 중에 잘 맞춘 것
  • FPR (X축) : 실제 클래스 FALSE 중에 못 맞춘 것 

※ 코드는 뒤에 실습때 할 예정이다.

'머신러닝2 > 수업 필기' 카테고리의 다른 글

머신러닝2 12주차  (2) 2024.12.11
머신러닝2 11주차  (0) 2024.12.11
머신러닝2 7주차 (2) - 코드 부분  (0) 2024.10.23
머신러닝2 7주차 (1)  (0) 2024.10.23
머신러닝2 5주차  (0) 2024.10.23