빅데이터 분석/수업 필기

빅데이터 분석 필기(1)

코딩입문시작 2024. 3. 5. 00:36

빅데이터 분석이란? 

  • 기획
  • 탐색
  • 분석
  • 해석

여기서 분석과 해석을 집중적으로 다루게 된다면, 데이터 마이닝 이라고 한다. 

 

데이터 마이닝이란 ?

  • 실무 (R과 파이썬) 를 통해 분석과 해석

※ 관련 자격증 : 사회조사 분석기사, 빅데이터 분석기사

→ 올해 끝나고, 졸업년도에 꼭 도전하기 !

실무에서는, 코딩도 물론 해야 하지만 엑셀은 필수적으로 하는 것이 좋다! 

 

1. 시각화 (그림, Chart) : 빅데이터 D.B.
2. 분석 및 해석 : 빅데이터 분석 (계산)

 

분석이란 ?

  • 모델링 (데이터의 형태를 식으로 만드는 작업)
  • x1, x2, x3, ... , xn → Y = aX + b

모델링이 되는 것이 있고, 안되는 것이 있다 !

 

정형 데이터 데이터
수치형
연속형 데이터 이산형 데이터
데이터
문자형
명목형 데이터 순서형 데이터

 

비정형 데이터 ?

  • 동영상, 이미지와 같이 크기를 가늠할 수 없고 고정된 비트 안에 다 들어가지 않는 데이터

※ 정형과 비정형 데이터를 다 합쳐, 빅데이터라고 한다.

 

기획탐색 : 전처리, 시각화 → 분석 : 회귀분석 (핵심) → 해석
(시각화, 기초이론 -> 회귀분석)

 

회귀분석 (회귀모형)

  • 통계학에서 회귀 분석(regression analysis)은 관찰된 연속형 변수들에 대해 두 변수 사이의 모형을 구한 뒤 적합도를 측정해 내는 분석 방법이다.

예를 들어, 

x1, x2, x3, ... , x40 와 같이 데이터 40개가 있다고 하자. 그 중에 하나를 대표하는 변수 (Y)로 잡고 그 Y를 나타내는 선형식을 만드는 것이다.  → Y, x2, x3, ... , x40 
Y = aX + b : 직선, 선형, 1차 함수, 1차 방정식

 

참고 사이트 : 회귀분석이란 무엇인가? :: R 기초 통계 | 마인드스케일 (mindscale.kr)

 

회귀분석이란 무엇인가? :: R 기초 통계 | 마인드스케일

회귀분석이란 무엇인가? 회귀분석(regression)은 가장 넓은 의미로는 독립변수(x)로 종속변수(y)를 예측하는 것을 의미한다.독립변수와 종속변수 체중과 식사량의 관계에 대한 모형을 만든다고 해

www.mindscale.kr

 


수업 중에 나왔던 단어 공부

 

SPSS 이란 ?

SPSS 사회과학 연구자들을 위한 통계 분석 앱으로 시작되었다. 대학 수준 학술연구를 위한 앱으로 사회학, 정치학과 경제학과 경영학 분야 등에서 널리 사용된다.

 

SAS 이란 ?

SAS(Statistical Analysis System)는 고급 분석, 다변량 분석, 비즈니스 인텔리전스 , 데이터 관리, 예측 분석을 위해 SAS 인스티튜트가 개발한 소프트웨어 제품군의 하나이다. 

'빅데이터 분석 > 수업 필기' 카테고리의 다른 글

빅데이터분석 필기 (6)  (0) 2024.04.21
빅데이터분석 필기 (5)  (0) 2024.04.21
빅데이터분석 필기 (4)  (0) 2024.04.21
빅데이터 분석 필기 (3)  (0) 2024.04.21
빅데이터분석 필기 (2)  (0) 2024.03.31