2020.4.15_총선2023. 4. 20. 15:57

 

 

반달가면 이글루에서 백업 - http://bahndal.egloos.com/637256  (2020.4.20)

 

우선, 이 글은 총선 사전투표가 조작되었다는 음모이론을 주장할 목적으로 작성한 것이 아니다. 이전 게시물들도 마찬가지다. 수자들로부터 계산한 통계 분포의 경향성이 뭔가 신기한(?) 모습을 보이기에 좀 더 자세히 살펴보기 위한 작업이다. 산술적 계산과 정치적 주장은 별개의 문제이며, 양쪽을 연결하기 위해서는 합리적인 인과관계가 나타나야 하므로 섣불리 예단하지는 말아야 할 것이다.

스프레드시트를 구성했더니 계산이 훨씬 편리해졌다. 여기서는 주로 계산 결과만 정리하려 하므로, 계산 방식과 전제 조건 등은 이전 게시물을 참고하자. 아래와 같다.

총선 사전투표 조작설과 보수 유튜버의 영향력에 대한 약간의 분석 작업

고양시갑 수수께끼 - 총선 사전투표/당일투표 차이에 대한 약간의 분석

스프레드시트 파일은 아래에 첨부한다. 리브레오피스 칼크(LibreOffice Calc) ods 파일과 MS오피스 엑셀 xlsx 파일이다. 작업은 리브레오피스로 했고, MS오피스 사용자가 볼 수 있도록 xlsx 형식으로도 저장했다. zip 압축을 풀면 두개의 파일이 있다.

2020_election1.zip
0.05MB


2020_election1.ods
md5sum: e527ddfa6793eb079605d4c731dc8f97
sha1sum: da366b0b32ee1f0b0d48140a73a308fe7627209e

2020_election1.xlsx
md5sum: 1c0c55db27d17d4fed6e40539e6de7c7
sha1sum: e43195d9d7ac74bf821bb8077fa3448360f54865

스프레드시트에서 붉은색은 선관위 선거통계시스템에 공개된 개표결과를 가지고 직접 입력한 것이고, 나머지 항목들은 이로부터 계산된 결과다.

관심이 가는 부분은 이전 게시물에서 이미 설명했듯이 본투표의 통계 분포와 비교할 때 사전투표의 통계 분포가 얼만큼 차이를 보이느냐다. 이 부분은 파란색으로 표시했다.

일반적으로 규모가 충분히 큰 같은 모집단에서 규모가 충분히 크게 추출된 표본은 통계적으로 유사한 경향을 보일 것이라 예상할 수 있고, 만약 크게 차이가 난다면 이 차이가 어떤 원인/영향으로 생길 수 있는지 생각해 보고 싶은 것이다.

[ 경기도 고양시갑 ]

고양시갑 선거구에서 민주당 문명순 후보, 통합당 이경환 후보, 정의당 심상정 후보가 대결했고 심상정 후보가 당선되었다.

고양시갑 선거구의 개별투표단위 전체에 대해 관내사전투표와 당일투표의 통계 분포의 차이는 아래와 같다. 당일투표의 통계 분포와 비교할 때, 관내사전투표의 분포가 얼마나 차이가 났는지를 볼 수 있다.

관내사전투표와 당일투표의 통계 분포 차이는 아래와 같다.

주교동: 민주당 6.975%, 통합당 -11.471%, 정의당 4.529%
원신동: 민주당 6.711%, 통합당 -7.047%, 정의당 0.378%
흥도동: 민주당 6.345%, 통합당 -7.249%, 정의당 0.928%
성사1동: 민주당 9.463%, 통합당 -8.072%, 정의당 -1.364%
성사2동: 민주당 7.533%, 통합당 -8.250%, 정의당 0.797%
고양동: 민주당 8.969%, 통합당 -8.829%, 정의당 -0.120%
관산동: 민주당 9.468%, 통합당 -9.398%, 정의당 -0.023%
화정1동: 민주당 7.942%, 통합당 -9.741%, 정의당 1.813%
화정2동: 민주당 10.874%, 통합당 -9.756%, 정의당 -1.098%

관내사전투표와 관련된 구체적인 계산 방식은 이전 게시물에 이미 상세히 적었으므로 여기서는 생략하고 결과만 옮겨 적었다. 중간 계산값 등 자세한 수치는 스프레드시트 파일의 첫번째 워크시트를 참고하자.

개표단위 전체를 계산했기 때문에 이제는 관내 당일투표와 관외사전투표를 비교할 수 있게 되었다. 아래와 같이 이전과 동일한 요령으로 계산할 수 있다. (스프레드시트에도 계산해 놓았다.)

고양시갑 선거구 관외사전투표의 득표수는 아래와 같다.

민주당 5052표
통합당 3697표
정의당 5770표

관외사전투표 소계는 14519표(5052+3697+5770=14519).

고양시갑 선거구 당일투표에서 민주당은 21809표, 통합당은 32583표, 정의당은 35820표를 획득했다. 각 개별투표단위의 당일투표 득표수를 합산한 결과다. 당일투표 소계는 90212표(21809+32583+35820=90212, 스프레드시트를 참고하자)

당일투표의 득표율은 아래와 같다.

민주당 24.175%(21809/90212*100=24.175)
통합당 36.118%(32583/90212*100=36.118)
정의당 39.706%(35820/90212*100=39.706)

만약 관외사전투표의 통계적 특성이 당일투표와 동일했다면, 각 정당은 관외사전투표에서 아래와 같이 득표했어야 한다.

민주당(가상) 3510표(14519*24.175/100=3510)
통합당(가상) 5244표(14519*36.118/100=5244)
정의당(가상) 5764표(14519*39.706/100=5764)

위의 가상 득표와 실제 관외사전투표의 차이는 아래와 같다.

민주당 1542표(5052-3510=1542)
통합당 -1547표(3697-5244=-1547)
정의당 6표(5770-5764=6)

위의 차이를 관외사전투표수 기준으로 비율을 계산하면 아래와 같다.

민주당 10.621%(1542/14519*100=10.621)
통합당 -10.656%(-1547/14519*100=-10.656)
정의당 0.041%(6/14519*100=0.041)

고양시갑 선거구의 경우 주교동을 제외한 모든 동에서 정의당만 사전투표와 당일투표의 통계 분포가 서로 부합하는 모습을 보인다. 관외사전투표도 정의당만 당일투표의 통계 분포와 매우 비슷하다. 관외/관내를 떠나서 사전투표에서 민주당만 몰표를 받은 모습이다.

수도권은 아니지만 비슷하게 민주당/통합당/정의당이 3파전을 벌인 선거구가 또 있어서 계산해 보았다. 경남 창원 성산이다. 스프레드시트 파일의 두번째 워크시트를 참고하자.

[ 경상남도 창원시 성산구 ]

창원 성산 선거구에서 민주당 이흥석 후보, 통합당 강기윤 후보, 정의당 여영국 후보가 대결했고 강기윤 후보가 당선되었다.

관내사전투표와 당일투표의 통계 분포 차이는 아래와 같다.

반송동: 민주당 2.308%, 통합당 -12.271%, 정의당 9.997%
중앙동: 민주당 2.524%, 통합당 -9.401%, 정의당 6.909%
상남동: 민주당 2.928%, 통합당 -12.111%, 정의당 9.199%
사파동: 민주당 1.990%, 통합당 -8.749%, 정의당 6.774%
가음정동: 민주당 3.068%, 통합당 -11.175%, 정의당 8.137%
성주동: 민주당 1.416%, 통합당 -10.736%, 정의당 9.344%
웅남동: 민주당 0.991%, 통합당 -8.760%, 정의당 7.824%

고양시갑과 마찬가지로 관외사전투표도 비교할 수 있었다. 관외사전투표의 통계 분포 차이는 아래와 같다.

민주당 9.961%
통합당 -7.473%
정의당 -2.469%

관내사전투표는 민주당이 당일투표의 통계 분포에 가장 가깝고 차이도 1~3%로 통계적으로 크게 무리가 없어 보이는 반면에 관외사전투표는 10%에 가까운 차이를 보인다. 게다가 정의당은 또 정반대의 경향성을 보인다.

관외사전투표에서는 민주당에 몰표가 쏟아지고 관내사전투표에서는 정의당에 몰표가 쏟아진, 마치 민주당과 정의당을 서로 바꿔놓은 듯한 모습이다. 어쨌든 통합당은 관외/관내를 불문하고 사전투표에서 참패한 형국.

현실의 통계에서 이런 모습을 볼 것이라고는 전혀 예상하지 못했기 때문에, 처음에는 내가 데이터 입력을 서로 바꿔서 한 줄 알았다. 아무튼 신기하다 -_-;

보너스로 이번에는 통합당 득표가 무의미한 선거구를 하나 골라 보았다. 광주광역시 북구갑이다. 스프레드시트 파일의 세번째 워크시트를 참고하자.

[ 광주광역시 북구갑 ]

광주 북구갑 선거구에서 민주당 조오섭 후보, 통합당 범기철 후보, 무소속 김경진 후보가 대결했고 조오섭 후보가 당선되었다. 통합당 범기철 후보는 득표율이 3% 미만이므로 무시하고 조오섭 후보와 김경진 후보의 대결만 살펴보았다.

관내사전투표와 당일투표의 통계 분포 차이는 아래와 같다.

중흥1동: 민주당 2.641%, 무소속 -2.553%
중흥2동: 민주당 0.218%, 무소속 -0.164%
중흥3동: 민주당 1.842%, 무소속 -1.765%
중앙동: 민주당 -5.632%, 무소속 5.747%
임동: 민주당 2.128%, 무소속 -2.077%
신안동: 민주당 3.022%, 무소속 -2.979%
우산동: 민주당 -0.98%, 무소속 1.016%
풍향동: 민주당 4.949%, 무소속 -4.876%
문화동: 민주당 2.081%, 무소속 -2.054%
문흥1동: 민주당 0.599%, 무소속 -0.577%
문흥2동: 민주당 2.404%, 무소속 -2.373%
두암1동: 민주당 -1.031%, 무소속 1.076%
두암2동: 민주당 3.174%, 무소속 -3.148%
두암3동: 민주당 1.127%, 무소속 -1.099%
오치1동: 민주당 2.019%, 무소속 -1.974%
오치2동: 민주당 1.496%, 무소속 -1.465%
석곡동: 민주당 -2.785%, 무소속 2.918%

관외사전투표의 통계 분포 차이는 아래와 같다.

민주당 8.216%
무소속 -8.207%

광주 북구갑의 관내사전투표는 전반적으로 민주당과 무소속 모두 당일투표의 통계 분포와 그리 큰 차이를 보이지 않으며, 충분히 수긍할 수 있는 양상이라고 생각된다. 반면 관외사전투표는 민주당에 몰표가 쏟아지며 관내사전투표와는 조금 다른 모습을 보인다. 
 
같은 모집단에 속한 표본이 그 규모가 충분히 큰데도 상당히 차이가 나는 결과를 나타낼 경우, 통계적 또는 수학적 측면에서 상정할 수 있는 원인은 보통 정해져 있다. 계산방식이 틀렸거나(설계/모델링), 계산이 틀렸거나(소프트웨어), 표본 데이터에 심각한 오류가 있거나(누락 또는 인위적 조작), 아니면 이러한 원인들이 조합되어 있을 것이라 추측하게 된다. 따라서 뭔가 이상한 점이 보인다면 이 세가지 가능성을 모두 생각해 보아야 될 것이다.

통계적/수학적 측면이 아니라 지리적/문화적/정치적 특징으로 인한 변수는 내가 통계/수학에 비해 훨씬 더 모르는 분야이고, 정치/문화적 센스가 매우 떨어지는 나의 능력으로는 어렵다. 예를 들어 창원 성산의 진보 지지층에서 관내사전투표한 사람들은 정의당에 몰표를 주고 관외사전투표한 사람들은 민주당에 몰표를 주는 경향을 설득력 있게 합리적으로 설명 가능하다면 흥미로울 듯하다.

어쨌든 결과가 일반적이지는 않기 때문에, 사전투표가 조작되었다는 식의 음모이론이 출현하는 것도 무리는 아닌 듯하다. 물론 그러한 음모이론의 신빙성 자체는 별개의 문제다. 

 

728x90
Posted by 반달가면