교란변수

정의

  • Confounding Variable
  • 상관관계나 인과관계를 가질 것으로 예상되는 변수 X와 Y 둘 다에 영향을 주는 변수
  • X와 Y의 원인이 되는 변수이다.

교란변수의 영향

(교란변수가 존재할 경우)

  • 변수 X, Y 간 실제 인과관계가 없음에도 상관관계를 가질 수 있다.
  • 변수 X, Y 간 인과관계가 있더라도, 그 인과관계가 과소추정되거나 과대추정될 가능성을 제공한다.

교란변수에 대한 고찰

  • 교란변수는 통계적 판단을 흐릴 수 있다.
  • 따라서 그 영향을 제거하고 변수 X와 Y의 관계를 명확히 보기 위한 통제 방법들을 활용해야 한다.

교란변수 예시

연구가설 결과 교란변수
운동을 많이 할수록 건강하다 운동한 사람들의 건강수치가 더 높다 연령 - 나이가 많으면 운동량이 적고 건강도 낮은 경향
유기농 식품을 먹을수록 건강하다 유기농식품을 먹는 사람들의 건강수치가 더 높다 건강 관심도 - 건강 관심이 많으면 유기농도 많이 먹고 건강관리도 함
SNS 사용시간이 높으면 외모 스트레스가 높다 SNS 사용시간이 높으면 외모 스트레스가 높다 비교하려는 성향이 큰 사람 - SNS도 자주 보고, 외모에 대한 스트레스도 많이 받음

교란변수 통제 방법들

통제 방법 설명
랜덤화 인과관계의 원인일 것으로 추정되는 변수 X 의 값을 무작위로 지정해 교란작용을 제거
층화 교란변수 Z의 값이 동질적인 그룹들을 각각 묶어 여러 층으로 나누고, 각 층별로 상관관계 관측
매칭 교란변수 Z의 값이 같은 개체끼리 짝지어 표집하는 방법
보정 중회귀분석을 이용하는 방법
성향점수  
도구변수  

Reference

통계로 세상 읽기 - 이긍희, 이기재, 장영재, 박서영, 한종대 공저
방송통신대 - 통계로 세상 읽기 강의

Comments