인과관계

정의

  • causality
  • 한 변수 X가 어떠한 값을 갖는 사건이, 다른 변수 Y가 어떠한 값을 갖는 사건의 원인이 되는 관계
  • 변수 X가 변수 Y의 원인이 되는 관계
  • 이를 “X가 Y를 일으키는 인과관계에 있다”라고 표현한다.
  • 즉, 한 변수가 다른 변수의 원인이 되는 것

예시 : 섭취한 열량(X)과 체중증가량(Y)

인과관계의 성립 필요 조건

X와 Y가 상관관계가 있어야 한다.

  • 상관관계가 없다면 인과관계도 없다고 봐야 한다.
  • 두 변수의 값이 서로 상관 없게 움직인다면, 원인과 결과의 관계로 보기 어렵기 때문
  • 단, 상관관계가 있다고 해서 인과관계가 있는 것은 아니다.

원인 변수가 결과 변수에 선행해야 한다.

  • 즉, 원인 변수가 결과 변수보다 먼저 일어나야 한다.
  • 이 순서가 뒤바뀌는 데이터가 하나라도 있다면, 진짜로 인과관계가 맞는지 의심해봐야 한다.

인과관계의 성립 충분 조건

인과관계 성립 충분 조건은 존재하는가?

  • 위에서 소개한 필요조건들이 갖춰진다고 해서 인과관계가 성립된다고 할 수는 없다.
  • 그렇다면 인과관계가 되기 위한 충분 조건은 무엇일까?
  • 아직 모두가 인정하는 인과관계 성립의 충분 조건은 정의되지 못하고 있다.

인과관계 성립 충분 조건의 후보들

  • 랜덤화 : 완벽한 랜덤화가 적용된 경우 인과관계가 성립한다고 볼 수 있다. 하지만 완벽한 랜덤화는 현실적으로 어렵다.
  • 상관관계가 매우 강력해야 한다.
  • 인과관계임을 뒷받침하는 배경지식이 있어야 한다.
  • 원인과 결과의 시간적 순서가 확실해야 한다.
  • 비슷한 상관관계가 독립적인 설정 하에서 여러 번 재현될 수 있어야 한다.

위 조건을 다 만족시켜도 인과관계가 있다고 확신할 수는 없으며, 따라서 학술연구에서 인과관계를 단정하는 경우는 많지 않다.

학술 연구에서의 인과관계 사례

  • 대부분의 연구 질문은 인과관계에 있다.
  • 이러한 연구 질문들은 완벽한 랜덤화(추후에 살펴봄)를 하지 않는 이상 인과관계로 증명하기 매우 어렵다.
  • 실험, 임상시험을 제외한 대부분의 연구에서 “데이터를 이용해 밝힌 것”은 인과관계가 아닌 상관관계일 뿐인 경우가 대부분이다.

Reference

통계로 세상 읽기 - 이긍희, 이기재, 장영재, 박서영, 한종대 공저
방송통신대 - 통계로 세상 읽기 강의

Comments