통계적 추론

정의

  • statistical inference
  • 표본에서 얻은 증거(데이터)를 기반으로 모집단을 이루는 확률 변수의 분포, 특성 그리고 모수를 추정하거나 검정하는 과정을 뜻한다.
  • 통계학의 핵심 영역이며, 통계학의 큰 분류인 기술 통계학과 추측 통계학 중 추측 통계가 바로 통계적 추론에 해당한다.
통계학 구분 설명
기술 통계학 평균 구하고, 표준편차 구하고..
추측 통계학 데이터를 통해서 추측하고 판단하는 것

통계적 추론의 원리

데카르트 : 진실을 알 수 없을 떄, 가장 그럴듯한 것을 따라야 한다. $\rightarrow$ 통계적 추론의 본질을 잘 나타내는 철학적 기반

추정(estimation)

  • 표본의 측정값인 데이터로부터 모집단 특성 정보(모수)를 가장 그럴듯하게 추정하는 과정.
  • 모집단의 모수의 값(이산) 혹은 범위(연속)을 추측하는 것

검정(hypothesis testing)

  • 어떤 사건이 일어났는데, 그 가능성이 매우 낮다면 그 사건은 “우연히”일어났다고 보기 어려우며, 따라서 해당 가설을 기각한다(믿지 않는다).
  • 모수에 대한 가설을 설정하고, 그 가설을 채택할지 여부를 결정하는 것

통계학의 역할

  • 과학철학자 이안 해킹 “통계학자는 기술을 발견하여 세상을 바꾸는 것이 아니라, 생각하는 방법이나 자기 견해를 내세우는 방법을 변화시켜 세상을 바꾼다.”
  • 즉, 통계학은 세상의 진리를 직접 밝히는 학문이 아니라, “어떻게 생각할 것인가” 라는 방법론을 제공하는 학문이다.

예시

1
2
3
4
5
- 우리나라 고등학교 3학년 학생들의 평균  추정  
- 모집단 : 우리나라 고등학교 3학년 학생 전체  
- 표본 : 일부 고등학교 3학년 학생  
- 확률변수 : 학생의   
- 2022 조사 결과 : 남자 174.5cm, 여자 161.9cm  

모든 고등학생을 모두 모아서 측정하는 것은 시간적, 공간적, 물리적 비용이 큼. 따라서 일부 고등학교의 학생들만 측정한 뒤(표본), 이를 통해 전체 학생의 평균 키를 추정한다.

추론의 과정

1
2
- 모집단 -> (표본추출) -> 표본 -> (자료정리) -> 정보
- 정보를 토대로 분석해 -> 통계적 추론을 뽑아냄

추론의 방법

1. 빈도주의 통계학과 베이즈 통계학

  • 빈도주의적 정의 : 동전 던지기를 반복하면 앞면이 나오는 횟수가 전체의 50%에 근접한다.
  • 베이즈 통계학 : 사전 확률을 기반으로, 관측 대상의 확률을 구하는(사후 확률) 방법

2. 통계 모형과 알고리즘 모형

  • 전통적 통계학은 데이터를 설명하는 통계 모형을 세우고, 입력에 따른 출력을 해석 가능한 방식으로 설명하려고 한다.
  • 머신러닝 등 알고리즘 기반 모형은 데이터 자체를 이용해 예측 능력을 극대화하는 데 중점을 두며, 이 과정에서 내부 작동 원리가 불투명해지며 black-box 모델이 되기도 한다.
  • 데이터가 충분히 많다면 알고리즘 모형이 통계 이론을 능가하는 예측력을 보이기도 한다.

Reference

통계로 세상 읽기 - 이긍희, 이기재, 장영재, 박서영, 한종대 공저
방송통신대 - 통계로 세상 읽기 강의
https://m.blog.naver.com/mmysmmys/222009435301

Comments