중심극한정리
정의
- central limit theorem
- 표본평균의 분포는 표본의 크기가 증가함에 따라 원래 모집단의 분포와 관계 없이 정규분포에 근사한다.
설명
- 원래 데이터 분포가 정규분포가 아닐 때도
- 심지어 삐뚤어진 분포(왜도), 다봉형 분포 등 어떤 형태라도
- 표본 크기 nnn이 커지면, 표본평균(average)의 분포는 정규분포 형태로 수렴헌다.
중요한 이유
- 현실 데이터는 대부분 정규분포가 아님.
- 그런데 평균에 관한 통계를 할 때는 정규분포를 가정하는 경우가 매우 많음.
- CLT 덕분에 정규분포 가정을 정당화할 수 있음.
- → 그래서 검정, 신뢰구간, 회귀 등의 이론 기반이 탄탄해짐.
Reference
통계로 세상 읽기 - 이긍희, 이기재, 장영재, 박서영, 한종대 공저
방송통신대 - 통계로 세상 읽기 강의
https://m.blog.naver.com/mmysmmys/222009435301
Comments