빅데이터분석 필기 (6)

빅데이터 분석/수업 필기

코딩입문시작 2024. 4. 21. 16:32

[ 복습 ]

산점도

빅데이터 분석 : 표본의 상관계수로 전체를 분석 및 미래를 예측하는 것

회귀분석 : 참값에 유사한 근삿값을 갖는 직선 (회귀직선) 을 그리도록 모형화하는 것

상관관계

인과관계

회귀분석

상관분석

회귀분석

회귀분석에서의 b0, b1을 찾았다면 적합 (fitting)

회귀식의 설명력

[ 6주차의 핵심 : 오즈비, 로지스틱 회귀 분석 ]

[ 시험문제 출제 : 빅데이터의 정의 및 개요, 하둡의 구성 ]

상관분석 : 모델링 X, 추정 및 검정
회귀분석 (Regression) : 수치형 데이터를 이용하여 분석한다. Input으로 수치형 데이터를 넣으면, Output으로 수치형 데이터 또는 문자형 데이터 (Good = 1, Bad =0) 으로 나온다.
이 식을 우리는 모델이라 부르며 이 과정을 모델링이라고 한다.
모델링이란 ? 예측함수를 생성하는 것이다. 독립변수와 종속변수를 가지고 계수들을 추정한다.
1. B0, B1의 추정 2. b0, b1의 신뢰성 및 타당성 검정 3. 모델의 타당성 검정
로지스틱회귀분석 (비선형)
판별분석

[ ★ 매우 중요, 시험 출제 ]

오즈비 : 성공확률과 실패확률의 비, 실패에 대한 성공의 확률, 1-p에 대한 p의 확률

로지스틱 회귀계수는 DB의 확률표본에 의하여 계산한다.

z의 크기 변화는 특정 계수만큼의 변화이다. 그 이유는 특정 계수가 기여도를 의미하기 때문이다.

로지스틱회귀는 S곡선으로 이루어져 있으며 비선형회귀분석이다. p(성공할 확률) (이)가 0.5보다 같거나 크면 1로 판정하고, 0.5보다 작으면 0으로 판정한다.

머신러닝1 #상관분석, 비즈니스커뮤니케이션1 #4주차, R언어 #기본함수, 비즈니스_커뮤니세이션1, 이산수학 #수, 통계학, 빅데이터분석 #anova분석, 머신러닝1 #회귀분석, 빅데이터분석 #판별분석 #분산분석, 머신러닝1 #데이터구조 #r언어, 머신러닝1 #카이제곱분석, 머신러닝1 #anova분석, 비즈니스커뮤니케이션, R언어 #평균 #표준편차 #분산, R언어 #도수분포표 #생성코드, 빅데이터분석 #요인분석, 머신러닝1 #z_test #t_test #평균이용분석, 머신러닝, 머신러닝1 #상관분석 #실습, 빅데이터분석,

코딩포트폴리오