여론조사 보도의 "오차범위 내 역전" 등 표현은 틀린 표현입니다.
페이지 정보
본문
예전 모공에서도 여론조사 관련해서 한번 글을 쓴 적이 있는데 비슷한 주제로 또 글을 쓰게 됩니다.
오늘 보니 여론조사 관련해서 몇몇 언론들이 저런 표현을 써서 기사 제목을 냈더군요.
조사방법론이나 통계학적으로 보면 다 틀린 표현입니다.
오차범위 내의 결과는 우열을 가릴 수 없다는 것이 통계적으로 정확한 해석입니다.
역전이라는 것은 누군가 열세를 뒤집고 우위를 점했다는 것을 말하지요.
그게 오차범위에 있는 결과를 보고서 하는 말이라면 역전이란 말을 써서는 안됩니다.
조사결과상 우열을 가릴 수 없는 상태인데 역전을 했다는 것 자체가 성립할 수 없으니까요.
여론조사를 비롯한 양적 조사에서 나온 결과값은 추정값입니다.
이 추정값은 표본집단의 평균을 반복 계산해서 추정해 낸 평균추정값을 중심으로 한 신뢰구간 내에 존재합니다.
예를 들어 추정된 지지율이 35%라고 하면 이 35%가 표본 평균을 반복해서 추정한 모집단의 평균값이지요.
그리고 이 평균값을 중심으로 신뢰수준에 따른 오차범위 내의 값이 신뢰구간에 들어가게 됩니다.
95% 신뢰수준이라는 것은 모집단의 실제 값이 같은 조사에서 이 구간 내에 있을 확률을 말합니다.
즉 35%의 지지율에 95% 신뢰수준이 +-3%p라면 실제 모집단은 32%에서 38% 구간 내에 있다는 것이 됩니다.
그런데 또 다른 집단의 지지율이 37%이고 같은 오차범위를 갖는다고 가정해 보겠습니다.
이러면 이 집단의 모집단은 34%에서 40%구간에 위치하게 됩니다.
그리고 앞서 제시한 집단과 95% 신뢰수준에서 34%에서 38%까지 겹치는 구간이 발생하게 되지요.
이 조사를 반복했을 때 계속해서 모집단이 겹치는 구간이 발생할 확률이 95%라는 뜻이 됩니다.
95%의 확률로 두 집단의 모집단이 겹쳐서 순서를 나눌 수 없게 되는 것이지요.
그런데 몇몇 언론들에서 이런 통계적 해석은 다 무시하고 오차범위 내 역전이라는 말을 거리낌없이 씁니다.
이러면 통계방법론 등에 대한 지식이 부족한 사람들에게는 많은 오해를 불러올 수 밖에 없습니다.
우열을 가릴 수 없는 결과를 두고 우열을 나누고 누가 앞섰다고 하고 있으니까요.
그리고 이런 오해는 이곳에 계신 분들 사이에서도 꽤 많이 퍼져있기도 합니다.
표집이나 이런 부분에 대한 것들은 조사가 나온 뒤에 따로 자료를 찾아보고 해야하지만
조사 또는 이를 인용한 기사가 나왔을 때 결과값과 오차범위를 잘 살피면 위의 내용은 금방 파악이 가능합니다.
이를 통해 우열이 나뉘는 상황과 나뉘지 못하는 상황만 잘 구분해도 불필요한 오해는 피할 수 있습니다.
그리고 보다 냉정하게 조사 결과를 보고 파악할 수 있을 것입니다.
몇몇 언론 기사들에서 저런 문제가 개선없이 반복되는 모습을 보고 부족한 글을 써 보게 됩니다.
감사합니다.
해방두텁바위님의 댓글의 댓글
Klaus님의 댓글
내란당 지지율이 더 올라갔다하면
요즘 사람들은 "아니 이런 일이 있었는데 정신나간 사람들이 그렇게나 많다고? 말도 안돼. 여론조사 믿으면 안되겠다" 라고 가는게 자연스러울겁니다
즉 여론조사의 대중적 신뢰도가 떨어져서 사람들이 여론조사 자체를 스킵하게 됨면서 여론조사 조작이 더이상 안먹히게 되는 거죠
해방두텁바위님의 댓글의 댓글
마루치1님의 댓글의 댓글
에스까르고님의 댓글
편의상 쓴다고는 하지만 부정확하고 부적절한 표현이라고 생각합니다.
정확하게 지적해주셔서 고맙습니다.
설중매님의 댓글