빅데이터분석 2

빅데이터분석 필기 (13)

교차표 (crosstabulation)범주형 변수(categorical variable, 범주유형을 값으로 갖는 변수, 명목변수) 간의 관계를 파악하고자 할 때 유용독립성검정(independence test)을 통해 범주형 변수 간의 관계에 대한 가설검정을 수행두 변수의 범주별 조합 빈도 수를 조사하여 작성한 표이다.수집한 데이터에 오류가 있는지를 파악하는데 활용이 가능하다.교차표에 두 변수를 조합하였을 때, 발생할 가능성이 없거나 희박한 경우가 나타난다면 데이터에 오류가 있을 수도 있음을 의미한다. [실습]

빅데이터 분석 필기(1)

빅데이터 분석이란? 기획 탐색 분석 해석 여기서 분석과 해석을 집중적으로 다루게 된다면, 데이터 마이닝 이라고 한다. 데이터 마이닝이란 ? 실무 (R과 파이썬) 를 통해 분석과 해석 ※ 관련 자격증 : 사회조사 분석기사, 빅데이터 분석기사 → 올해 끝나고, 졸업년도에 꼭 도전하기 ! 실무에서는, 코딩도 물론 해야 하지만 엑셀은 필수적으로 하는 것이 좋다! 1. 시각화 (그림, Chart) : 빅데이터 D.B. 2. 분석 및 해석 : 빅데이터 분석 (계산) 분석이란 ? 모델링 (데이터의 형태를 식으로 만드는 작업) x1, x2, x3, ... , xn → Y = aX + b 모델링이 되는 것이 있고, 안되는 것이 있다 ! 정형 데이터 데이터 수치형 연속형 데이터 이산형 데이터 데이터 문자형 명목형 데이터 ..