통계적 가설검정의 절차
통계적 가설검정
- Fisher 와 Neyman-PEarson 방법을 결합해 이용한다.
절차
1. 가설 설정
- 비교의 기준을 먼저 세우는 단계
- 귀무가설 : 차이나 효과, 영향이 없다.
- 대립가설 : 차이나 효과, 영향이 있다.
2. 유의수준 설정
- 귀무가설이 맞는데도 기각할 확률을 허용하는 상한선
3. 검정통계량 선택
- 연구의 목적이나 데이터의 형태에 따라 적절한 검정법과 통계량을 정함
- 어떠한 잣대로 판단할지 결정하는 단계
- 예 : t-test, z-test, 카이제곱검정, F-검정 등
4. 데이터를 이용해 검정통계량 계산
- 표본 데이터를 통계량 공식에 넣어 검정통계량 값(test statistics)을 구함
- 현재 관측값이 기준 대비 얼마나 극단적인지 측정
5. 귀무가설 하에서 검정통계량 분포와 비교
- 두 가지 방식이 가능하다.
| 방식 | 관점 | 결과 |
|---|---|---|
| Fisher 접근 | p-value 산출 | 관측값이 우연일 확률이 얼마나 되는가 |
| Neyman-Pearseon 접근 | 기각역 설정 | 검정력 고려 + 의사결정 중심 |
6. 판단 (결정)
| 방식 | 결과 |
|---|---|
| p-value 기준(Fisher) | 유의확률 < 유의수준 : 귀무가설이 참이라고 하기엔 관측값이 매우 희귀한 사건 유의확률 > 유의수준 : 귀무가설이 참이 아니라고 할 수 없음 |
| 기각역 기준(Neyman-Pearson) | 검정통계량 값이 기각역(critical value)안에 있으면 귀무가설을 기각 ” 밖에 있으면 -> 귀무가설 기각 불가 |
예시
0. 연구 주제(연구 질문)
- 이번에 개발한 신약은 치료 호과가 있는가?
1. 가설 설정
- 귀무가설 : 신약의 치료 효과는 없다.
- 대립가설 : 신약의 치료 효과는 있다.
2. 유의수준 설정
- 5%로 설정한다.
- 즉, 관측/시험된 표본을 포함하여 그 이상으로 극단적인 값이 관측될 확률이 5% 미만
3. 검정통계량 선택
- 비교하는 값이 완치율 “비율”간 비교이므로 z-test 통계량을 선택한다.
4. 데이터를 이용해 검정통계량 계싼
- 치료군 100명, 대조군 100명에 대해 임상시험을 수행
- 치료군에서는 1주일 내 완치율 50%
- 대조군에서는 1주일 내 완치율 20%
- 두 집단에서 치료율이 30% 차이를 보임
- $Z \approx 4.42$
- p-value = 0.0000087 (0.00087%)
5. 귀무가설 하에서 검정통계량 분포와 비교
- Z = 4.42는 표준정규분포에서 극단적으로 큰 값
- p-value = 0.0000087 로 매우 작음
6. 의사결정
- $p-value \, < a(0.05)$ -> 귀무가설 기각
- 결론 : 이번 관측값은 우연이라고 보기 어렵다.
Reference
통계로 세상 읽기 - 이긍희, 이기재, 장영재, 박서영, 한종대 공저
방송통신대 - 통계로 세상 읽기 강의
Comments