통계학의 역사
연대표
| 시점 | 시대 | 설명 |
|---|---|---|
| 17~18c | 확률의 시대 | - Pascal, Fermat : 주사위 도박 판돈 분배를 고민하다 확률의 개념을 수리적으로 정리함 - Bernoulli : 대수의 법칙, 확률을 빈도론적으로 정의한 첫 번째 사람 - de Moivre : 정규분포 발견 - Basyes : 베이즈 정리 발견. 베이즈 통계학의 시발점. - 불확실성을 측정하는 방법 연구 |
| 18c 중~19c 중 | 오차이론의 시대 | - Laplace : 프랑스의 수학자 - Gauss : 독일의 수학자 - 중심극한정리, 오차의 분포를 통해 정규분포의 시대를 열었음 |
| 19c 중, 후 | 통계의 시대 | - Quetelet : 평균인 - Galton : - 정보량이 많아지면서 이를 요약하고 정리하고, 생각하는 방법 전환 |
| 20c | 통계학의 시대 | - 확률론과 데이터의 측정/요약을 융합해 현대 통계학 완성 |
통계학 이전
사람들은 오랫동안 자연을 관측해왔고, 자연현상의 원리를 설명하기 위해 이를 표현하려고 노력해왔다. 그리고 사람들은 꽤 오랜 시간 동안, 세상은 “시계”처럼 오류 없이, 정해진 원리에 따라 움직인다고 생각했다.
그런데 자연을 관측할 때마다 그 결과가 다르게 나타나는 것을 알게 되었고, 이러한 자연 현상의 분포를 그려 보았더니 많은 케이스에서 정규분포가 나타난다는 것을 알게 되었다.
측정의 시대
- 18~ 19세기 유럽은 산업혁명과 함께, 세상의 온갖 것을 측정하여 데이터화 하기 시작했다.
- 또한 이 데이터를 통계로 정리해 출판하는 통계가 유행했다.
- 각종 사회현상을 측정하고, 이들을 충분히 모아 보면 정규분포 형태로 분포한다는 것을 알게 되었다.
통계학의 정립
- 20세기 시작 전후, 측정된 통계들이 확률이론과 만나면서 통계학이 정립되었다.
- Francis Galton(프란시스 골턴) 은 중앙값, 표준편차, 분위수, 상관계수, 회귀 등을 발명하며 통계학의 중요한 기틀을 마련했다.
- University College London, Galton 의 인체측정학 연구실 기반의 세계 최초의 통계학과가 만들어졌고, 초대 학과장은 Karl Pearson(칼 피어슨) 이었다.
- 여기서 세계 최초의 통계학 잡지이자, 현재도 최고 수준의 통계학 잡지인 Biometrika 가 만들어짐
Francis Galton 은 다윈의 친척이며, 지문을 발견했다.
Karl Pearson 은 카이제곱 검정을 제안한 현대 통계학의 아버지.
통계학의 수리적 정립 : 1900 ~ 1950년
| 인물 | 내용 |
|---|---|
| Karl Pearson | 카이제곱 검정(1900) 적률추정법 |
| Gosset | t 분포 : small data(작은 데이터)에서 가장 잘 이용됨 시뮬레이션 방식으로 이 t 분포를 관측함 이후 Fisher 가 이를 수학적으로 증명 |
| Fisher | 현대 통계학을 정리, 정립합 (통계학 책은 대부분 Fisher) 실험계획법(1921) : 데이터의 효율적 설계, 측정, 파악 최대 가능도 추정법, 충분성, 효율성 (1925) |
| Neyman | 최적가설검정 (1933) 신뢰구간 (1937) 칼 피어슨의 연구소에서 재직, 이후 미국 통계학 발전의 핵심적 역할 |
| Wald | 결정이론(1950) |
1950년대 이후
- 컴퓨터의 발전으로 수리통계가 아닌, “경험적” 통계 방법이 만들어짐
- 경험적 베이즈 추론, 일반화 선형모형 등
- 부트스트랩, MCMC (1979)
- 통계 패키지 확산 : SAS, SPSS, MINITAB, R 등 (1980 ~ 1990)
- 와이드 데이터, 빅데이터를 분석하기 위한 FDR, Iasso, 데이터마이닝 (2000년대)
와이드 데이터(wide data)
관측치(관측량)은 적고, 변수는 많은 데이터
예를 들면 DNA. 관측 사람 수는 적으나, 유전 정보 내 변수는 굉장히 많음
통계학의 명칭 변화
- 통계학이라는 명칭은 점점 데이터 과학이라는 명칭으로 바뀌고 있다.
- 1960년대 이후 컴퓨팅 파워와 데이터의 크기가 증대되면서, 데이터 친화적 방향으로 바뀌었다.
- 1962년 튜키라는 사람이 EDA라는 용어를 만들었다.
- 21세기 들어 스마트폰, IoT 확산에 따라 많은 양의 데이터가 축적하면서, 데이터과학으로 발전했다.
- 통계 모형도 기존의 수학적 기반에서 알고리즘 모형 중심으로 발전하고 있다.
Reference
통계로 세상 읽기 - 이긍희, 이기재, 장영재, 박서영, 한종대 공저
방송통신대 - 통계로 세상 읽기 강의
https://m.blog.naver.com/mmysmmys/222009435301
Comments