머신러닝을 위한 통계학2/수업 필기

머신러닝을 위한 통계학2 3주차

코딩입문시작 2024. 10. 28. 01:03

벡터공간 (vector space) 은 벡터의 선형결합으로 표현되며, 함수를 포함하여 모든 것을 벡터의 선형결합으로 표현할 수 있다.

Dot Product : 두 벡터간의 연관성을 알 수 있다. 

  • 고유벡터는 변화의 주된 방향이다.
  • 고유값은 변화의 크기이다. 고유값이 클수록 변화 크기가 크다. 

※ 고유백터끼리는 반드시 직교한다!!

집단에서 특징을 파악하여 통계를 내야 한다. 그 특징에는 크게 2가지가 있다.

  • 중심 (대표성) : 평균
  • 산포 (변동성) : 분산, 편차 → 영향력

 

  • 분산하나의 요인에 대한 변동이다.
  • 공분산 요인에 대한 변동이다. → 두 요인이 독립관계일 때, 공분산은 존재하지 않는다. 

  • 공분산을 표준화시켜도, 분산적인 특징은 동일하다.

  • det(A) : 선형모델의 행렬식 A로 인한 영역의 특징 (확대 or 축소)을 파악할 수 있으며, 0이 아니라는 것은 행렬식을 구성하는 모든 열(행)벡터가 서로 독립임을 의미한다. 
  • Dot Product : 행렬식의 열벡터(요인, 특성)간의 관계의 강도 파악