[통계] 통계적 가설검정의 절차

유의수준 설정, 관측, 유의확률 계산, 귀무가설 기각 평가

2025-11-29 1 minute read

통계적 가설검정의 절차

통계적 가설검정

Fisher 와 Neyman-PEarson 방법을 결합해 이용한다.

절차

1. 가설 설정

비교의 기준을 먼저 세우는 단계
귀무가설 : 차이나 효과, 영향이 없다.
대립가설 : 차이나 효과, 영향이 있다.

2. 유의수준 설정

귀무가설이 맞는데도 기각할 확률을 허용하는 상한선

3. 검정통계량 선택

연구의 목적이나 데이터의 형태에 따라 적절한 검정법과 통계량을 정함
어떠한 잣대로 판단할지 결정하는 단계
예 : t-test, z-test, 카이제곱검정, F-검정 등

4. 데이터를 이용해 검정통계량 계산

표본 데이터를 통계량 공식에 넣어 검정통계량 값(test statistics)을 구함
현재 관측값이 기준 대비 얼마나 극단적인지 측정

5. 귀무가설 하에서 검정통계량 분포와 비교

두 가지 방식이 가능하다.

방식	관점	결과
Fisher 접근	p-value 산출	관측값이 우연일 확률이 얼마나 되는가
Neyman-Pearseon 접근	기각역 설정	검정력 고려 + 의사결정 중심

6. 판단 (결정)

방식	결과
p-value 기준(Fisher)	유의확률 < 유의수준 : 귀무가설이 참이라고 하기엔 관측값이 매우 희귀한 사건 유의확률 > 유의수준 : 귀무가설이 참이 아니라고 할 수 없음
기각역 기준(Neyman-Pearson)	검정통계량 값이 기각역(critical value)안에 있으면 귀무가설을 기각 ” 밖에 있으면 -> 귀무가설 기각 불가

예시

0. 연구 주제(연구 질문)

이번에 개발한 신약은 치료 호과가 있는가?

1. 가설 설정

귀무가설 : 신약의 치료 효과는 없다.
대립가설 : 신약의 치료 효과는 있다.

2. 유의수준 설정

5%로 설정한다.
즉, 관측/시험된 표본을 포함하여 그 이상으로 극단적인 값이 관측될 확률이 5% 미만

3. 검정통계량 선택

비교하는 값이 완치율 “비율”간 비교이므로 z-test 통계량을 선택한다.

4. 데이터를 이용해 검정통계량 계싼

치료군 100명, 대조군 100명에 대해 임상시험을 수행
치료군에서는 1주일 내 완치율 50%
대조군에서는 1주일 내 완치율 20%
두 집단에서 치료율이 30% 차이를 보임
$Z \approx 4.42$
p-value = 0.0000087 (0.00087%)

5. 귀무가설 하에서 검정통계량 분포와 비교

Z = 4.42는 표준정규분포에서 극단적으로 큰 값
p-value = 0.0000087 로 매우 작음

6. 의사결정

$p-value \, < a(0.05)$ -> 귀무가설 기각
결론 : 이번 관측값은 우연이라고 보기 어렵다.

Reference

통계로 세상 읽기 - 이긍희, 이기재, 장영재, 박서영, 한종대 공저
방송통신대 - 통계로 세상 읽기 강의

Twitter Facebook LinkedIn

Comments

You May Also Enjoy

[devpi] 실무에서 devpi 서버를 빠르고 안정적으로 구축하는 방법

2026-02-23 4 minute read

실무는 실전이다.

[PostgreSQL] PostgreSQL 데이터베이스와 스키마 Database and Schema

2026-02-19 2 minute read

데이터베이스와 스키마, 둘은 무엇이 다른 걸까?

[PostgreSQL] PostgreSQL DDL - DB, 테이블 생성 수정 삭제 등

2026-02-18 4 minute read

DB, Schema, Table, Index, View, Role 을 생성, 수정, 삭제 하기

[PostgreSQL] PostgreSQL 사용자 생성, 수정, 삭제 그리고 권한 부여와 회수

2026-02-16 2 minute read

PostgreSQL의 사용자와 권한에 대한 명령어