머신러닝1/수업 필기 12

머신러닝1 필기 (2)

데이터의 활용중심 극한을 이루는 수치형 데이터에 주로 사용된다.분산이 너무 크면 결과를 저해할 수 있다. (분산 너무 크면X)이상값&결측값이상값 : 이상값은 데이터 세트의 다른 관찰에서 크게 벗어나는 데이터 포인트나머지 데이터를 고려할 때 예상할 수 있는 것과 현저하게 다른 값 → 데이터 수집 또는 기록의 잠재적 이상 또는 오류의 결과결측값 : 사용자가 잘못 입력하거나 누락한 값극단값 / 극한값극단값 / 극한값 : 데이터 세트의 최소값과 최대값을 나타낸다. → 분포의 양쪽 끝에서 가장 극단적인 값일반적으로 오류나 비정상적인 상황으로 인한 결과임을 암시하는 증거가 없는 한 데이터 세트에 유지된다. 분포의 특성 ?왜도(Skewness) : 확률 변수의 평균에 대한 확률 분포의 비대칭성을 측정한다. (즉, 데..

머신러닝1 필기 (1)

나의 각오는 하나다. 늦은 만큼, 열심히 올해 나는 3학년 전필 수업인 머신러닝1 수업을 듣기로 하였다. 이 수업은 김창균 교수님께서 수업을 하시고, 데이터 사이언스로 진로를 잡은 나로서는 상당히 기대가 되는 수업이다. 어려운 수업이 되겠지만 잘 이겨낼 예정이다! [ 강의 목표 ] 통계를 사용하는 이유와 학습 방법에 대한 이해 통계에 대한 이해를 통해 문제 해결 실제 데이터를 실습하며 방법론에 대한 이해 실제로 데이터가 만들어지고 학습되는 과정을 이해 소규모 프로젝트를 통해 새로운 문제를 해결 머신러닝1 - 기초통계 (기술통계) - 통계 ? 데이터 수집, 기술 통계, 추론 통계, 확률, 샘플링, 가설검정 데이터에서 유효한 결론을 도출하여 실제 문제를 해결하고 삶과 비즈니스의 다양한 측면을 개선하는 데 도..