대선 결과 예측 조사, 믿을 만하나

2012.12.08 10:05 입력 2012.12.08 17:53 수정

“어떤 이야기가 나오고 있나요.” 선거일에 임박해 기자들이 지인들로부터 자주 듣는 질문이다. 언론에 공표되지 않는 ‘고급정보’에 대한 문의다. 여론조사 공표 금지 기간이 되면 더 폭증하는 질문이다. “여론조사 결과를 믿을 수 없다. 기관마다 모두 다른 결과를 어떻게 믿으라는 말이냐.” 선거 때마다 나오는 소리다. 주로 여론조사 결과에서 밀리는 쪽 이야기다.

총선만 놓고 이야기하면 이 주장은 맞다. ‘표 계산’이 아니라 선거에 대해 이른바 ‘과학적 여론조사 기법’이 도입된 1987년 이후, 총선 결과에 대한 추세 예측은 지금까지 전부 틀렸다. 지난 4·11 총선 때도 대부분의 여론조사 기관이 내놓은 추정 결과는 야권 승리였다. 그런데 대선은 다르다. 대선 여론조사 결과 예측은 거의 대부분 맞았다.

그리고 꽤 정확했다. 무엇 때문일까. 지난 5월, 여지없이 틀린 총선 예측 조사를 두고 문제점을 되짚는 토론회가 여의도에서 열렸다. 토론회에서 발제를 맡은 한귀영 한겨레사회정책연구소 연구위원은 “전국이 하나의 선거구인 대선과 달리 총선은 선거구가 전국 246개이고, 포괄하는 지역이 작기 때문에 큰 변수보다 작은 변수가 영향을 미칠 가능성이 높다”고 말했다. 뒤집어 말하자면 대선은 총선과 반대이기 때문에 결과 예측의 정확도가 상당히 높다는 것이다.

채 10일이 남지 않은 18대 대선의 결과는 과연 어떻게 될 것인가. 지난 11월 28일, 대전역 앞에 모여든 시민들이 한 대선후보의 연설을 지켜보고 있다./강윤중 기자

대선 여론조사와 총선 조사가 다른 이유

한 여론조사 기관의 분석팀장을 맡고 있는 A씨는 이번 대선 여론조사의 특징을 다음과 같이 말했다. “여력이 되는 한 모든 분석기법이 다 실험되고 있다. 불과 1년 전과는 비교할 수 없을 정도로 정확도는 향상되었다.” 이를테면 12월 6일, 리서치앤리서치(R&R)는 ‘M7Q모델’이라는 자체적으로 개발한 투표율 예측모델을 사용한 여론조사 결과를 발표했다. 기존 여론조사는 실제 투표를 하지 않을 사람들의 ‘의사’도 포함되어 있다. 그런데 이들이 모두 투표장에 가는 것이 아니다. 실제 ‘투표장에 가는 사람들’, 즉 투표 확실층의 지지도를 조사해보면 실제 투표율에 근접한 결과가 나올 것이라는 것이다. 이 조사 결과, 박근혜 새누리당 후보는 오차범위를 넘어서 문재인 민주통합당 후보를 앞서는 것으로 나왔다. 여론조사 기관마다 결과는 차이가 난다. 그렇다면 흔히 이야기하는 것처럼 여론조사 결과 전체를 믿을 수 없는 걸까.

아니다. <여론조사, 과학인가 예술인가>를 쓴 강흥수 박사는 여론조사 기관마다 결과가 다를 때 추세를 알아볼 수 있는 가장 쉬운 방법이 있다고 말했다. “간단하다. 동일 시기 여론조사 결과를 모두 합산하는 것이다. 합산에 대해 산술적인 평균을 내면 그것이 실제 여론과 결과가 제일 비슷하다고 보면 된다.” 다음이나 네이버와 같은 포털은 매일 각 언론이 발표하는 데이터를 한자리에 모아놓았다. 여기서 산술평균을 계산해보면? 12월 7일 현재, 박근혜 후보가 앞서고 있다. 12월 6일 안철수 전 후보의 문재인 후보 지지선언 및 7일 공동유세 등이 반영되어야겠지만, 현재의 추세가 지속되면 박근혜 후보가 대통령이 될 가능성이 높다. 결론은 정해진 것일까.

“그렇지 않다. 특히 지금의 여론조사들을 보면 해석에서 많은 문제를 보이고 있다.” 강 박사는 덧붙였다. 여론조사 분석에서 가장 간과하지 말아야 할 것을 현재 여론조사 결과 발표 보도에서는 놓치고 있다는 것이다. 강 박사는 “결과는 점 단위이지만 해석은 구간으로 해야 맞다”고 말했다. 이것은 무슨 이야기일까. 이를테면 동일 여론조사 기관이 두 차례 조사를 했다고 하자. 첫 번째 조사에서 B 후보는 43.1%를 받았고, 두 번째 조사에서는 44.5%를 받았다. 선관위는 모든 여론조사 관련 보도에서 조사방법 및 신뢰수준과 오차범위를 밝히도록 의무화하고 있다. 이 경우 95% 신뢰수준에서 ±3.1%포인트라고 하자. 그렇다면 B 후보의 지지율은 늘어났다고 이야기할 수 있을까. 강 박사에 따르면 이 경우 “전과 동일한 결과를 얻었다”고 해석하는 것이 맞다. 오차범위 내에서의 지지율 변동이기 때문이다. 95% 신뢰수준이라는 것은 100번 같은 조사를 했을 때 다섯 번은 틀릴 가능성이 높다는 뜻이다. 오차범위는 각각 위 아래로 3.1%포인트를 벗어났을 때만 다른 결과라고 할 수 있다는 것이다. “그것을 보도하는 언론의 문제다. 0.1~0.2%포인트 늘어나거나 줄어든 것을 두고 마치 커다란 변화가 일어난 것처럼 기사를 쓴다. 여기에 조사방법, 신뢰수준, 오차의 정도가 모두 다른데 다른 여론조사 기관의 결과를 단순 비교해 해석하는 경우가 많다.”

미국 SNS에서 대선 때 오바마와 롬니가 거론되는 네트워크 분석을 시각화한 자료./출처= Phys.org

여론조사 분석 보도, 무엇이 문제인가

지금의 여론조사 추이를 바탕으로 한 경마식 보도는 생각 이상으로 큰 문제를 갖는다고 그는 말했다. 흔히 사람들의 의견을 측정하는 수단인 여론조사가 반대로 사람들의 의견에 영향을 미치는 경우는 두 가지로 설명된다. 밴드왜건 효과와 언더독 효과다. 밴드왜건은 주류, 다수의 견해에 편승하는 사람들의 심리다. 언더독은 반대로 약자에게 쏠리는 관심을 말하는 것이다. “실제 선거에서 사람들은 각 후보가 어떤 공약을 내놓는지를 봐야 하는데, 언론들의 경쟁적인 여론조사 결과 보도는 결국 거기에 매달려 정치공학적인 표 계산에 사람들의 관심이 쏠리도록 유도한다.”

현재의 여론조사 기법은 지난 2010년을 기점으로 드라마틱한 변화를 보였다. “KT의 전화번호부에 등재된 집 전화 여론조사로만은 정확한 여론조사 결과를 얻을 수 없다”는 비판이 비등하자, RDD(Random Digit Dialing, 임의 전화걸기)방식과 휴대폰 여론조사를 결합한 방식이 전격적으로 도입되었고, 그 후 조사협회와 정치조사협회 회원사로 등록된 대부분의 여론조사 기관이 채택하고 있는 방식이다. 하지만 이 방법이 과연 정확한 여론을 반영하는 기법인가의 여부는 아직 검증되지 않았다. 그 이전까지 여론조사의 상식은 이것이다. “전수조사를 한다든가, 표본 샘플링 수를 늘리는 것보다 체계적으로 임의 샘플링한 것이 더 과학적 예측 결과를 가져온다.” 다시 말해, 샘플링 수를 1000에서 2000으로 늘린다고 더 모집단의 실제 여론에 가까운 조사 결과가 나오는 게 아니라는 뜻이다. 그런데 이게 RDD+휴대폰 방식으로 바뀌면서 달라졌다. 주어진 모집단으로부터 샘플링되는 것이 아니라 ‘실제 번호가 존재하는지 알 수 없는’ 임의의 샘플링을 바탕으로 할당된 숫자를 채우는 식으로 여론조사가 진행되기 때문에 대표성 문제가 제기되는 것이다. 또 다른 여론분석 기관의 C 이사는 “흔히 ARS 여론조사에 휴대폰 여론조사 20%를 더하는 식으로 쓰고 있는데 왜 20%인지, 30%가 적절한지, 아니면 50%가 적절한지 정해진 기준이 없는 것은 사실”이라며 “사실 20% 수준으로 휴대폰 여론조사의 비율이 결정된 건 여론조사의 비용 때문이라고 보면 맞다”고 말했다. 휴대폰 여론조사는 일반 전화면접 조사에 비해 2배 이상 돈이 들어가는데, 언론사 공표 여론조사로는 수지를 맞출 수 없기 때문이라는 것이다.

지난 2007년 대선과 비교해서 올해 대선에서 새롭게 등장한 또 하나의 예측수단이 있다. 바로 SNS와 같은 빅데이터를 활용하는 것이다. “2012년 선거는 빅데이터 선거가 될 것”이라는 구호는 한국에서도 올해 초부터 나왔던 말이다. 빅데이터의 활용은 두 가지 측면이 있다. 하나는 빅데이터를 활용한 선거이고, 또 하나는 예측이다. 이번 대선에서 트위터나 페이스북과 같은 SNS 관계망은 선거에 대한 방대한 사람들의 의견을 담고 있다. 과거에는 없던 자료다. 이 자료 속에서 관계의미망을 캐내 선거전략에 활용하거나, 또한 결과 예측에서도 활용할 수 있을 것이라는 점이었다.

빅데이터를 분석해 전략을 컨설팅하는 업체들이 지난해 말부터 급증했다. 현재는 약 40여개. 언론사나 각 캠프에서는 유력 후보와 관련, SNS 동향을 한눈에 보여주는 상황판이 만들어졌다. 그런데 대부분 트위터 분석에 머무르고 있다. ㈜가비아가 페이스북 데이터를 다룬 ‘소셜픽’이라는 서비스를 지난 12월 3일 내놓았지만, 현재까지 소셜픽을 제외하고 SNS를 대표하는 또 하나의 축인 페이스북을 다루는 경우는 거의 없다.

서울대 차세대 융합기술연구원이 지난 18대 국회의원들의 법안 투표 결과 데이터를 바탕으로 만들어놓은 국회의원 투표성향 자료. 정당별로 투표성향이 몰려 있다는 것을 알 수 있다.<br />http://www.politiz.org/index.php — 서울대 차세대 융합기술연구원이 지난 18대 국회의원들의 법안 투표 결과 데이터를 바탕으로 만들어놓은 국회의원 투표성향 자료. 정당별로 투표성향이 몰려 있다는 것을 알 수 있다.
http://www.politiz.org/index.php

2012년 대선, 빅데이터 선거 실패한 까닭

특히 올해 치러진 미국 대선에서 빅데이터 활용이 주목을 받았다. 오바마 캠프의 ‘빅데이터에 기반한 마이크로 타기팅’이 벤치마킹 대상으로 각광을 받았다. SNS 데이터를 활용, 지지자로부터 받아낸 프로파일 정보를 활용해 개인의 ‘준비 정도’에 맞춘 커스터마이즈화한 선거운동을 펼치는 것이다. 빅데이터가 예측의 수단이 될 수 있다는 것을 실제로 증명해낸 사람은 뉴욕타임스에 선거 예측 블로그를 개설한 네이트 실버다(박스 참조).

그렇다면 한국은? 얼핏 보면 적용이 가능할 것으로 보였다. 특히 안철수 후보 캠프의 페이스북 선거전략이 돋보였다. 비록 사퇴했지만, 안철수 캠프 측에서 개설한 여러 페이스북 페이지에 ‘좋아요’ 버튼을 누르고 댓글을 단 이들의 네트워크 정보는 고스란히 남아 있다. 후보들 사이의 공동선거 논의와는 별도로 이런 정보가 문재인 캠프에 제공돼 문 캠프 측이 안 후보 지지자들을 마이크로 타기팅에 기반해 지지·설득작업을 한다면? 선관위 관계자는 “케이스를 놓고 봐야 알겠지만, 어쨌든 선거법 적용 대상은 아니다”라고 말했다.

“2012년 한국 대선에서 빅데이터 전략은 거의 실패했다.” 김도훈 트리움 대표의 말이다. 냉정한 평가다. “예를 든 안철수의 경우, 페이스북 활용에는 성공했다. 안철수의 경우 조직이 없었던 것을 감안하면 페이스북을 통해 유권자와 직접 소통하는 전략이 도드라져 보였다. 그건 다른 후보 진영도 마찬가지다.” 그런데 실패했다고 보는 이유는 뭘까. “안철수 측의 페이스북 활용은 SNS가 아니면 알리기 어려운 정보나 소신을 전달하는 데 잘 쓴 부분도 있지만, 빅데이터를 체계적으로 수집해서 전략에 반영하기보다 기존 홍보회사의 문법을 그대로 따라가는 식이었다. 즉 SNS를 활용해 일방적으로 메시지를 뿌리는 정도의 수단으로 사용되었을 뿐이다.”

김 대표가 보기엔 그것은 문재인 후보나 박근혜 후보 모두 마찬가지였다. 안 후보의 경우 내부 사정으로 SNS 담당 팀장이 두 차례 교체되었다. 문 후보의 경우 현재 SNS팀은 60명으로 구성되어 있다. 그 중 10여명이 분석 관련 인력이지만 빅데이터에 기반한 선거전략 마련은 시도조차 못했다. 문재인 캠프 SNS팀 관계자는 “초기에 온라인에서 정책 결정과 관련해 모델을 개발하는 등의 작업이 있었지만 실제 선거에 들어가면서 그나마의 여유도 없어졌다”고 말했다.

그럼에도 불구하고 올해 대선에서 처음으로 적용되기 시작한 빅데이터의 활용은 앞으로는 중요한 추세가 될 것으로 보인다. 서울대 차세대융합기술연구원이 내놓은 폴리타이즈(www.politiz.org)는 18대 국회의원들의 본회의 법안 투표 결과를 바탕으로 의원의 투표성향을 시각화해놓은 결과를 한눈에 볼 수 있도록 되어 있다. 정당을 제외하고 의원들의 개인정보, 이를테면 출신학교, 국회 소모임, 재산정도, 선수(選數) 등의 데이터가 추가될수록 결과값은 더 정교해진다. 데이터가 쌓일수록 이후 투표경향을 예측할 수 있게 된다.

말하자면 이런 것이다. D씨는 지난 몇 년간 수없이 많은 길거리 서명에 참여해 왔다. 이를테면 해고자 복직이라든가 국가보안법 폐지와 같은 길거리 서명에 이름과 연락처, 주소 등의 정보를 제공했다. 만약 이런 정보들이 사장되지 않고 누적되어 있고 누군가 분석한다면? D씨가 이번 대선에서 어떤 후보를 택할 것인가에 대한 추론이 가능해진다. 여기에 D씨가 SNS에 올린 단문(短文)들에 대한 시멘틱(의미망) 분석이 더해지면, 그 예측이 사실이 될 확률은 극적으로 증폭된다. 그렇다고 100% 예측이 가능한 것은 아니다. 이만재 서울대 차세대융합기술연구원 특임연구위원은 빅데이터 분석을 ‘기상관측’에 비유했다. 아무리 수백년의 방대한 데이터가 쌓여 있다고 하더라도 일주일 앞의 날씨 결과를 정확하게 예측하는 것은 불가능하다. 하지만 큰 ‘추세’를 전망하는 것은 가능해진다.

“중요한 것은 시간이다. 오바마 선거운동본부도 그렇고 네이트 실버가 비교적 정확하게 대선 결과를 맞힐 수 있었던 것은 2008년부터 축적한 자료가 있었기 때문이다.” 차재필 한국정보화진흥원 선임연구원의 말이다. “남는 문제는 개인의 프라이버시 문제인데, 미국의 경우 스스로 공개한 데이터나 알려진 데이터만을 통해 작업을 했고 그런 노하우가 오랫동안 축적되었기 때문에 빅데이터 대선이 가능했다.”

김도훈 대표에 따르면 빅데이터의 활용은 사실 정치 이전에 기업들이 먼저 시작했고 현재도 폭발적으로 성장하는 중이다. 종전에 제품에 대한 기호분석이나 평가에는 여론조사나 FGI(포커스 그룹인터뷰)밖에 없었던 데 비해 빅데이터 분석은 위험징후에서부터 평판, 새로운 기획을 세우는 데 유의미한 결과를 보여주고 있다. 이만재 연구위원은 “사실 그동안 빅데이터 활용에 대한 요구는 많았지만, 일정 정도 거품이 끼어 있었던 것이 사실”이라며 “아직은 빅데이터의 활용이 초기 단계이지만 아마 중요성이 강조되는 다음 단계쯤이 진짜로 중요한 신호가 아닐까 생각한다”고 덧붙였다.

네이트 실버의 미국 대선 예측은 어떻게 성공했을까

미국 대선에서 빅데이터의 활용과 관련해 특히 주목을 끈 것이 네이트 실버라는 34세 청년의 선거예측이었다. 이미 2008년 대선과 미국 상·하원 선거 결과를 정확하게 예측해 2009년 타임지의 ‘세계에서 가장 영향력이 있는 인물 100인’에 선정된 바 있는 네이트 실버는 이번 2012년 미국 대선 결과도 정확하게 예측해내 관심을 모았다. 지난 9월 그가 낸 <신호와 잡음(the Signal and the noise)>이라는 책은 2012년 인터넷 서점 아마존에서 가장 많이 팔린 책이었다. <신호…>의 부제는 ‘왜 대부분의 예측은 실패하는 데 비해, 몇몇은 실패하지 않는가’다. 다시 말해 자신의 예측이 성공하는 소수 중 하나라는 주장이다. 그는 책에서 우연이 작용하는 카드게임이나 야구경기 예측과 달리 “오히려 대선과 같은 정치적 이벤트의 예측은 훨씬 쉽다”고 주장했다. 한마디로 다양한 추세를 종합하면 된다는 것이다.

네이트 실버가 먼저 명성을 떨친 건 PECOTA라고 이름을 붙인 미국 메이저리그 승부 예측 도구였다. 네이트 실버가 활용한 것이 바로 빅데이터다. 대부분 여론조사 기법에 의존한 것과 달리 그는 다양한 다른 조사 결과들, 이를테면 동성결혼 지지도에 대한 주별 수치를 예측 자료로 사용한다. 미국에서 동성결혼 지지자들은 대부분 민주당 지지자일 가능성이 높다. 사형제 찬반이나 이라크전 철군, 오바마 의료보험 개혁에 대한 태도 등도 마찬가지다. 각각의 케이스에서 민주당과 공화당 지지 비율은 서로 다를 수 있다. 다른 데이터들과의 관계 속에서 각각의 비율에 대한 자신의 수식을 개발해 정확도를 높이는 방식이다. 책에서 네이트 실버는 자신의 방법론을 ‘베이어의 정리(bayes theorem)’에 기반한 확률론적 예측이라고 말한다. 빅데이터 영역에서 베이어 정리가 적용되면 데이터가 누적되면 될수록 예측 결과가 실제와 일치할 가능성이 높아진다는 것이 네이트 실버의 주장이다.