통계학의 역사

연대표

시점 시대 설명
17~18c 확률의 시대 - Pascal, Fermat : 주사위 도박 판돈 분배를 고민하다 확률의 개념을 수리적으로 정리함
- Bernoulli : 대수의 법칙, 확률을 빈도론적으로 정의한 첫 번째 사람
- de Moivre : 정규분포 발견
- Basyes : 베이즈 정리 발견. 베이즈 통계학의 시발점.
- 불확실성을 측정하는 방법 연구
18c 중~19c 중 오차이론의 시대 - Laplace : 프랑스의 수학자
- Gauss : 독일의 수학자
- 중심극한정리, 오차의 분포를 통해 정규분포의 시대를 열었음
19c 중, 후 통계의 시대 - Quetelet : 평균인
- Galton :
- 정보량이 많아지면서 이를 요약하고 정리하고, 생각하는 방법 전환
20c 통계학의 시대 - 확률론과 데이터의 측정/요약을 융합해 현대 통계학 완성

통계학 이전

사람들은 오랫동안 자연을 관측해왔고, 자연현상의 원리를 설명하기 위해 이를 표현하려고 노력해왔다. 그리고 사람들은 꽤 오랜 시간 동안, 세상은 “시계”처럼 오류 없이, 정해진 원리에 따라 움직인다고 생각했다.

그런데 자연을 관측할 때마다 그 결과가 다르게 나타나는 것을 알게 되었고, 이러한 자연 현상의 분포를 그려 보았더니 많은 케이스에서 정규분포가 나타난다는 것을 알게 되었다.

측정의 시대

  • 18~ 19세기 유럽은 산업혁명과 함께, 세상의 온갖 것을 측정하여 데이터화 하기 시작했다.
  • 또한 이 데이터를 통계로 정리해 출판하는 통계가 유행했다.
  • 각종 사회현상을 측정하고, 이들을 충분히 모아 보면 정규분포 형태로 분포한다는 것을 알게 되었다.

통계학의 정립

  • 20세기 시작 전후, 측정된 통계들이 확률이론과 만나면서 통계학이 정립되었다.
  • Francis Galton(프란시스 골턴) 은 중앙값, 표준편차, 분위수, 상관계수, 회귀 등을 발명하며 통계학의 중요한 기틀을 마련했다.
  • University College London, Galton 의 인체측정학 연구실 기반의 세계 최초의 통계학과가 만들어졌고, 초대 학과장은 Karl Pearson(칼 피어슨) 이었다.
  • 여기서 세계 최초의 통계학 잡지이자, 현재도 최고 수준의 통계학 잡지인 Biometrika 가 만들어짐

Francis Galton 은 다윈의 친척이며, 지문을 발견했다.

Karl Pearson 은 카이제곱 검정을 제안한 현대 통계학의 아버지.

통계학의 수리적 정립 : 1900 ~ 1950년

인물 내용
Karl Pearson 카이제곱 검정(1900)
적률추정법
Gosset t 분포 : small data(작은 데이터)에서 가장 잘 이용됨
시뮬레이션 방식으로 이 t 분포를 관측함
이후 Fisher 가 이를 수학적으로 증명
Fisher 현대 통계학을 정리, 정립합 (통계학 책은 대부분 Fisher)
실험계획법(1921) : 데이터의 효율적 설계, 측정, 파악
최대 가능도 추정법, 충분성, 효율성 (1925)
Neyman 최적가설검정 (1933)
신뢰구간 (1937)
칼 피어슨의 연구소에서 재직, 이후 미국 통계학 발전의 핵심적 역할
Wald 결정이론(1950)

1950년대 이후

  • 컴퓨터의 발전으로 수리통계가 아닌, “경험적” 통계 방법이 만들어짐
  • 경험적 베이즈 추론, 일반화 선형모형 등
  • 부트스트랩, MCMC (1979)
  • 통계 패키지 확산 : SAS, SPSS, MINITAB, R 등 (1980 ~ 1990)
  • 와이드 데이터, 빅데이터를 분석하기 위한 FDR, Iasso, 데이터마이닝 (2000년대)

와이드 데이터(wide data)
관측치(관측량)은 적고, 변수는 많은 데이터
예를 들면 DNA. 관측 사람 수는 적으나, 유전 정보 내 변수는 굉장히 많음

통계학의 명칭 변화

  • 통계학이라는 명칭은 점점 데이터 과학이라는 명칭으로 바뀌고 있다.
  • 1960년대 이후 컴퓨팅 파워와 데이터의 크기가 증대되면서, 데이터 친화적 방향으로 바뀌었다.
  • 1962년 튜키라는 사람이 EDA라는 용어를 만들었다.
  • 21세기 들어 스마트폰, IoT 확산에 따라 많은 양의 데이터가 축적하면서, 데이터과학으로 발전했다.
  • 통계 모형도 기존의 수학적 기반에서 알고리즘 모형 중심으로 발전하고 있다.

Reference

통계로 세상 읽기 - 이긍희, 이기재, 장영재, 박서영, 한종대 공저
방송통신대 - 통계로 세상 읽기 강의
https://m.blog.naver.com/mmysmmys/222009435301

Comments