통계학 4

머신 러닝을 위한 통계학 필기 (4)

[ 배경 지식 ] 모수 ↔ 통계량 확률적 관점 : 이미 알고 있는 모집단에서 어떤 사건이 일어날 확률에 관심이 있다. ※ 이미 알고 있는 모집단 이라면, 시점, 대상, 알고있는 특성을 말한다. 여기서 중심, 산포를 가지고 모수(특성)를 파악한다. 통계적 관점 : 표본에서 얻은 정보를 이용하여 미지의 모집단을 미루어 짐작하는 추론에 관심이 있다. ※ 데이터 (DATA)를 가지고 통계 (PROCESS) 를 거쳐 정보 (INFORMATION) 을 알아낸다. 통계를 적용할 때 한 가지 주의해야 할 점 통계는 목적에 따라 다르게 이용될 수 있다는 점이다. 이러한 통계적 해석의 오류를 범하지 않기 위해서는 상황을 고려하여 해석되어야 한다는 점이다. ★ 통계학에 사용되는 가정은 크게 두 가지 : 1) 데이터에 대한 ..

머신 러닝을 위한 통계학 필기 (3)

다시 한번, 복습하자. 데이터란 무엇인가? 대상이 되는 집단을 구성하는 객체 (개체)들의 특징을 나타내는 변수들의 측정값 (FACT) 이다. 자료 : 사람, 물건, 조건, 상황을 묘사하는 것으로 기본적인 사실들의 집합 정보 : 의사결정에 도움이 되도록 가공되거나 요약된 형태의 자료 → 데이터 확률 (Probability) VS 통계 (Statistics) 확률 : 하나의 사건, 개별적인 x 통계 : 집단의 사건, 여러 x들의 합 통계의 예시를 보자. 동전 던지기를 10회 시행했을 때, 개별 동전이 앞면이 나올 확률 1/2과 뒷면이 나올 확률 1/2을 신경을 쓰는가? 아니다. 앞면이 몇번 나왔고, 뒷면이 몇번 나왔는지를 신경쓴다. 조사에는 두 가지가 있다. 전수 조사 : 모집단 구성원 전체를 조사 및 분석..

머신 러닝을 위한 통계학 필기 (2)

Chap.1 : Data & Statistics 통계학은 왜 필요한가 ? 기업 (또는 우리)는 항상 의사결정 (선택)을 하게 된다. 의사결정의 결과가 중요할수록 ↑, 정확한 선택↑ 을 해야 한다. 만족도는 올리고, 불확실성은 줄이기 위해 여러 변수들을 고려하여 의사결정을 한다. 의사결정은 목적이 있어야 하는데, 이익 측면에서 최대화하고 손실 측면에서는 최소화해야 한다. 미래에 대한 의사결정을 정확히 하기 위해서는 먼저, 의사결정 대상(집단)의 특징을 파악하는 것이 선행되어야 한다. 대상의 특징을 객관적으로 파악하기 위해서는 정량적으로 파악해야 하며, 이때에 정량적으로 파악한 자료를 데이터 라고 한다. 이처럼, 데이터를 통해서 대상의 특징을 체계적으로 파악(분석, 해석)하는 방법이 통계학이다. 통계가 머신..

머신 러닝을 위한 통계학 필기 (1)

DT : 모든 것이 디지털화 되는 시대 정보시대 → 디지털전환시대 (Digital Transformation Era) Digital = Data ↔ Analog 2022년도의 모바일 데이터 트래픽이 2016년 대비 6년 만에 10배 정도 증가 AI : → 생성형 검색 패러다임 ChatGpt 구글이 왜 지배했느냐? 검색엔진 ! 구글 : 모든 데이터를 실시간으로 가지고 있다. Q 데이터를 왜 수집을 하느냐? A 데이터를 갖고, 가공하여 정보를 얻고자 수집을 한다. 정보에게 있어, 중요한 것은 "정확성, 대표성, 신뢰성, 시간" → 이것을 가지고, 경영자의 의사 결정 불확실성을 낮추고 의사 결정을 하기 위해서 도입되는 것이 AI (Artificial Intelligence) : 인공지능 ↔ 인간지능 인공지능 ..