머신러닝 2

머신러닝1 필기 (3)

선형구조-리스트데이터 유형을 저장하고, 저장된 데이터들을 그룹화할 수 있는 데이터 구조숫자, 문자, 논리값 ... 등등 다양한 데이터 유형의 요소가 포함될 수 있다. 각각의 다른 데이터 형태를 모두 묶어서 그룹화할 수 있다. 물리에서 벡터란 ?크기와 방향을 갖는 물리량벡터는 사물의 움직임을 프로그래밍하기 위한 가장 기본적인 구성요소 프로그램에서 벡터란 ?값을 저장하고, 조작할 수 있는 기본 데이터 구조숫자, 문자 또는 논리 값과 같은 동일한 데이터 유형의 요소를 보유할 수 있는 1차원 배열R의 벡터는 combine을 나타내는 c(  )함수를 사용하여 만들 수 있다. 리스트자료를 순서대로 한 줄로 저장하는 자료구조여러 자료가 일직선으로 서로 연결된 선형 구조배열단일 타입으로 구성되는 자료구조대규모 다차원 ..

머신러닝1 필기 (2)

데이터의 활용중심 극한을 이루는 수치형 데이터에 주로 사용된다.분산이 너무 크면 결과를 저해할 수 있다. (분산 너무 크면X)이상값&결측값이상값 : 이상값은 데이터 세트의 다른 관찰에서 크게 벗어나는 데이터 포인트나머지 데이터를 고려할 때 예상할 수 있는 것과 현저하게 다른 값 → 데이터 수집 또는 기록의 잠재적 이상 또는 오류의 결과결측값 : 사용자가 잘못 입력하거나 누락한 값극단값 / 극한값극단값 / 극한값 : 데이터 세트의 최소값과 최대값을 나타낸다. → 분포의 양쪽 끝에서 가장 극단적인 값일반적으로 오류나 비정상적인 상황으로 인한 결과임을 암시하는 증거가 없는 한 데이터 세트에 유지된다. 분포의 특성 ?왜도(Skewness) : 확률 변수의 평균에 대한 확률 분포의 비대칭성을 측정한다. (즉, 데..