심슨의 역설과 그 발생 원인 및 사례
2025.05.14
1. 심슨의 역설
심슨의 역설은 데이터를 전체적으로 합쳐서 분석했을 때와 데이터를 성격이 다른 그룹으로 나누어 분석했을 때의 결과가 상반되는 현상을 말한다. 이는 데이터의 구성 비율 차이로 인해 발생하며, 데이터의 숨겨진 변수를 파악하여 올바르게 해석해야 한다.
2. 심슨의 역설 사례
COVID-19 백신 A와 B의 사례를 통해 심슨의 역설을 설명하였다. 전체 데이터를 보면 백신 A가 더 효과적이지만, 환자의 중증도에 따라 나누어 보면 백신 B가 더 효과적인 것으로 나타났다. 이는 각 그룹의 구성 비율 차이로 인한 것으로, 숨겨진 ...
2025.05.14