머신러닝을 위한 통계학2/수업 필기

머신러닝을 위한 통계학2 2주차

코딩입문시작 2024. 10. 27. 22:49

두 벡터가 서로 독립일 때, 두 벡터는 수직 관계를 이루기 때문에 cos 값은 0이 나온다.

벡터는 크기와 방향의 값을 갖는 데이터를 순서대로 나열한 것이다. 데이터를 벡터로 표현하면, 벡터를 이용하여 처리할 수 있다.

행렬은 벡터를 또 다른 벡터로 변환시키는 일종의 연산자 (영향력) 로 볼 수 있다.

▶ 기저 벡터 변형을 통한 벡터의 선형변환

행렬의 곱 또는 행렬과 벡터의 곱을 기저 벡터의 변형을 통한 벡터의 선형 변환으로 해석

행렬식

  • 행렬식(det(A))은 해당 벡터로 만들어지는 영역으로서, 해당 벡터의 행렬식 값이 0이면 해당 벡터는 동일한 선상에 존재하는 벡터를 의미한다. 

매우 중요

Cartesian 좌표 : 서로 독립 → 사영을 하여, 유사도 측정에 사용한다.

 

행렬 A의 선형변환고유벡터고유값 성분으로 분해한다는 것이다.

기저벡터 : 선형 공간의 모든 벡터를 선형결합으로 나타낼 수 있는 벡터들의 집합이다.

고유벡터 : 선형결합에 의해 방향이 변하지 않는 벡터이다.

고유벡터들은 서로 직교한다. 방향은 그대로이고, 크기만 변화한다. 

  • 고유벡터 : 선형변형의 방향
  • 고유값 : 선형변형의 크기

공분산 : X의 편차와 Y의 편차를 곱한 값들의 평균으로, 데이터에 따라 공분산 크기가 달라진다. 

공분산은 두 변수 간에 양의 상관관계가 있는지, 음의 상관관계가 있는지 정도만 알려줌 + 상관관계가 얼마나 큰지는 제대로 반영X

상관계수 (매우 중요!!!)

  • 공분산을 표준화한 값이다.
  • 값은 -1 에서 1 사이의 값이다. → 절댓값은 1보다 작거나 같다.