2022.3_20대_대선2023. 5. 15. 13:17

 

 

 

반달가면 이글루에서 백업 - http://bahndal.egloos.com/656275 (2022.3.22)

 

선거 득표율 분포는, 관측 지점이 충분히 많고(수십개소 이상) 유권자 대다수가 각자 자신의 의지로 투표하여 상호 독립성과 무작위성을 유지했다면, 가우스 분포(정규분포)를 보일 것이다. 모집단의 분포와 무관하게 표본집단의 기대값(여기서는 득표율)들의 집합은 가우스 분포로 수렴하는 것으로 수학적으로 증명되어 있기 때문이다.

이와 관련된 내용은 지난 4.15 총선 이후에 정리했던 아래의 게시물을 참고하기 바란다.

월터 미베인 교수의 총선 투표 조작 관련 논문에 대한 약간의 고찰

 

선거의 이상징후에 대한 통계적 탐지 가능성(Klimek, et al.)

 

득표율 분포 그 자체로 부정선거 가능성을 100% 보증하지는 않는다. 그러나 분포 형태가 가우스 분포(정규분포)에서 심하게 벗어나 있을 경우, 인위적인 조작이 가해졌을 가능성을 의심할 수 있다.

자, 그러면 이번 2022년 제20대 대통령 선거의 득표율 분포를 일부나마 살펴보자. 아래의 파일은 이번 대선의 서울 관내사전투표의 분포를 살표보기 위해 작업한 파일이다. 리브레오피스(LibreOffice) 칼크(Calc)를 이용했으며, 개표결과는 중앙선관위 선거통계시스템에서 가져왔다. zip 파일을 풀면 칼크에서 작성한 ods 파일이 나온다.

 

2022_seoul_pre.zip
0.11MB

 

이재명, 윤석열, 심상정 후보의 관내사전투표 득표율이 어떤 분포를 보이는지 히스토그램을 그려보았다. 심상정 후보의 득표율은 이재명/윤석열 후보에 비해서 상당히 낮기 때문에 같은 그래프에서 그리면 제대로 비교가 되지 않아서 별도로 그렸다.

먼저 이재명/윤석열 후보의 득표율을 보자. 득표율 구간을 2%, 3%, 4% 단위로 분할해서 분포를 그려 보았다. 가우스 분포에 근접한다면 봉우리가 하나이고 좌우대칭인 종 모양(bell shaped)이 나타나야 할 것이다.

 

 

좌우대칭인 단봉 곡선이 아니라 한쪽으로 찌그러지면서 작은 봉우리가 하나 더 존재하는 모습이다. 가우스 분포와는 확실하게 차이가 있다.

이번에는 심상정 후보의 득표율을 보자. 득표율 구간을 0.2%, 0.3%, 0.4% 단위로 분할해서 분포를 그렸다.

 

 

흥미롭게도, 심상성 후보의 득표율 분포는 이재명/윤석열 득표율 분포에 비해 훨씬 더 가우스 분포와 유사해 보인다. 약간 찌그러지긴 했지만 이재명/윤석열 득표율처럼 현저하게 균형이 무너진 모습은 아니다.

만약 인위적인 조작이 있었다면 이러한 조작은 이재명/윤석열 후보의 투표지에만 주로 영향을 미치고 심상정 후보의 투표지에는 별로 영향을 주지 않았을 것으로 보인다. 조작하는 입장에서는 당연할 수 있겠다. 득표율이 현저히 낮은 표본은 건드려봐야 실익이 별로 없을 것이기 때문이다.

하나만 가지고는 부족한 감이 있으므로, 서울 본투표를 비롯해서 몇개 더 살펴볼 예정이다.

728x90
Posted by 반달가면