통계적 가설검정의 절차

통계적 가설검정

  • Fisher 와 Neyman-PEarson 방법을 결합해 이용한다.

절차

1. 가설 설정

  • 비교의 기준을 먼저 세우는 단계
  • 귀무가설 : 차이나 효과, 영향이 없다.
  • 대립가설 : 차이나 효과, 영향이 있다.

2. 유의수준 설정

  • 귀무가설이 맞는데도 기각할 확률을 허용하는 상한선

3. 검정통계량 선택

  • 연구의 목적이나 데이터의 형태에 따라 적절한 검정법과 통계량을 정함
  • 어떠한 잣대로 판단할지 결정하는 단계
  • 예 : t-test, z-test, 카이제곱검정, F-검정 등

4. 데이터를 이용해 검정통계량 계산

  • 표본 데이터를 통계량 공식에 넣어 검정통계량 값(test statistics)을 구함
  • 현재 관측값이 기준 대비 얼마나 극단적인지 측정

5. 귀무가설 하에서 검정통계량 분포와 비교

  • 두 가지 방식이 가능하다.
방식 관점 결과
Fisher 접근 p-value 산출 관측값이 우연일 확률이 얼마나 되는가
Neyman-Pearseon 접근 기각역 설정 검정력 고려 + 의사결정 중심

6. 판단 (결정)

방식 결과
p-value 기준(Fisher) 유의확률 < 유의수준 : 귀무가설이 참이라고 하기엔 관측값이 매우 희귀한 사건
유의확률 > 유의수준 : 귀무가설이 참이 아니라고 할 수 없음
기각역 기준(Neyman-Pearson) 검정통계량 값이 기각역(critical value)안에 있으면 귀무가설을 기각
” 밖에 있으면 -> 귀무가설 기각 불가

예시

0. 연구 주제(연구 질문)

  • 이번에 개발한 신약은 치료 호과가 있는가?

1. 가설 설정

  • 귀무가설 : 신약의 치료 효과는 없다.
  • 대립가설 : 신약의 치료 효과는 있다.

2. 유의수준 설정

  • 5%로 설정한다.
  • 즉, 관측/시험된 표본을 포함하여 그 이상으로 극단적인 값이 관측될 확률이 5% 미만

3. 검정통계량 선택

  • 비교하는 값이 완치율 “비율”간 비교이므로 z-test 통계량을 선택한다.

4. 데이터를 이용해 검정통계량 계싼

  • 치료군 100명, 대조군 100명에 대해 임상시험을 수행
  • 치료군에서는 1주일 내 완치율 50%
  • 대조군에서는 1주일 내 완치율 20%
  • 두 집단에서 치료율이 30% 차이를 보임
  • $Z \approx 4.42$
  • p-value = 0.0000087 (0.00087%)

5. 귀무가설 하에서 검정통계량 분포와 비교

  • Z = 4.42는 표준정규분포에서 극단적으로 큰 값
  • p-value = 0.0000087 로 매우 작음

6. 의사결정

  • $p-value \, < a(0.05)$ -> 귀무가설 기각
  • 결론 : 이번 관측값은 우연이라고 보기 어렵다.

Reference

통계로 세상 읽기 - 이긍희, 이기재, 장영재, 박서영, 한종대 공저
방송통신대 - 통계로 세상 읽기 강의

Comments