2008년 04월 15일
민주화 이후 투표율 경향 (보론)
정통고품격서비스님이라는 분이 [윤형군 트랙뷋] 총선 투표율 회귀분석이라는 글을 써서 나와 한윤형님에게 트랙백하셨는데 한윤형님의 표현에 따르면 "자신에게 유리한, 혹은 자신이 설명할 수 있는, 또는 자신이 유일하게 이해할 수 있는 논점만을 뽑아내어 그것에 대해 반론한 후 나머지 문제에 대해서는 일언반구 언급도 하지 않는" 사람이 "자기가 의도한 바를 회귀분석할 능력이 없고, 자신의 분석을 이해할 능력이 없"을리가 있나.
회귀분석은 독립변수들로부터 종속변수를 예측하는 통계분석의 일종이다. 이것은 무엇을 중심으로 보느냐에 따라 여러가지로 활용할 수 있다. 이미 정리된(또는 정리했다고 생각하는) 논점이지만 이번 총선 투표율이 저조한 이유는 민주화 이후 급격한 투표율 감소의 결과일 수도 있고 최근의 노무현 정권과 민주당의 정치적 실패로 인한 정치적 의사표현의 포기일 수도 있다. 당장 가진 자료만으로는 어느쪽인지 알 수 없다. 내가 민주화 이후 투표율 경향에서 투표율을 회귀분석한 이유는 민주화 이후 투표율 감소 경향을 통계적으로 통제해서 최근의 정치적 사건들이 투표율에 미친 영향을 알아보기 위해서다. 그래프를 보면 잘 드러나지만 2004년 총선은 투표율 자체는 1996년보다 낮지만 감소 경향을 고려하면 오히려 대단히 높다는 것을 알 수 있다. 올해 총선에서는 그런 차이가 나타나지 않는다. 따라서 분석 결과만 놓고 말한다면 올해 총선의 낮은 투표율이 민주당의 정치적 실패에서 비롯된 것이라고 보기는 어렵다.
그래프 자체를 이해하기는 썩 어렵지 않은데 아마도 로그승산(logit)과 가변수 회귀분석 때문에 정통고품격서비스님이 잘못 이해하신 모양이다. 회귀분석은 많은 경우 y = a + bx 꼴의 직선의 방정식 형태를 사용한다. 물론 y가 종속변수고, x가 독립변수. 여기에는 여러가지 이유가 있는데 일일이 설명하긴 어렵고 하옇든 그렇다.
그런데 투표율은 0%~100% 사이의 값이기 때문에 직선의 방정식에 적합(fitting)시키면 독립변수가 일정 범위를 넘어가면 투표율이 마이너스가 되거나 100%를 넘어버리게 된다. 그래서 투표율을 로그승산이라는 형태로 변형을 시킨다. 어떤 확률 p에 대해 로그 승산은 log( p / (1-p) )인 값을 말한다. 결과적으로는 아래와 같은 꼴의 곡선에 적합시키는 것과 같다.
로그승산 t는 1/(1+exp(-t))라는 식에 넣어야 다시 확률 p가 된다. 예를 들어 2000년 부근에 거의 0인건 투표율 p가 아니고 로그승산 t이므로 투표율은 50% 근처가 되겠다. y절편이 132라는 것은 투표율이 132라는 게 아니고 약 100%에서 시작해서 투표율이 떨어진다는 말이다. 그리고 1년에 0.067씩 떨어지는 건 투표율이 아니고 로그승산이기 때문에 투표율이 얼마나 떨어지느냐는 딱 집어 말할 수 없다.
그 다음에 elecP와 elecR. 이건 가변수(dummy variable)라고 한다. elecP는 대선, elecR은 지방선거. 총선을 기준으로 해서 대선과 지방선거라는 '종류'가 얼마나 영향을 미치는지 알기 위해 넣은 변수다. 총선의 경우는 elecP와 elecR을 모두 0으로하고 대선은 elecP만 1, 지방선거는 elecR만 1로 설정하면 선거의 종류에 따른 투표율의 변화를 알 수 있다.자세한 설명은 생략한다고 했지만 그래프를 봐도 알 수 있고 본문에 써놨듯이 대선이 총선에 비해 약 0.691이 일관되게 높다. 그러니까 정통고품격서비스님이 생각하는 것처럼 0.691과 대선의 투표율을 곱하는 게 아니고 대선 여부를 나타내는 변수를 곱하는 것이다. 대학에서 배우는 통계 기법 중에 '분산분석'은 컴퓨터가 나오기 전에 회귀분석을 계산하기 복잡해서 사용하던 방법으로 실제로는 회귀분석에서 가변수를 사용하는 것과 똑같다.
내가 처음부터 자세한 설명을 생략한다고 했을 때는 다 이유가 있었다. 배보다 배꼽이 더 크다.
그 외의 댓글에 대한 대답. 8비트 소년님은 시간에 따라 투표율이 떨어지는 건 현상일 뿐 시간의 흐름 자체가 투표율 저하를 설명할 수 없다고 말하셨는데 그건 경우에 따라 다르다. 이 분석에서 특기할 점은 시간의 흐름이 투표율 저하를 대단히 많이 설명한다는 사실이다. 연도와 선거의 종류가 종속변수의 분산을 약 93% 설명한다. 일반적으로 사회과학에서 이만큼 높은 수치가 나오는 경우가 거의 없다. 2004년 총선에서도 알 수 있듯이 투표율은 분명히 선행하는 정치적 사건으로부터 영향을 받는다. 그 영향의 크기를 정확히 알 수는 없지만 정치적 사건이 일정한 간격으로 나타나는 것도 아닌만큼 시간의 흐름에 따라 투표율이 일관되게 감소하긴 어렵다. 다른 국가의 투표율을 보면 예를 들어 미국의 경우 베트남전 시기를 전후해서 투표율이 많이 떨어졌다. 따라서 시간의 흐름에 따라 투표율이 일관되게 떨어진다면 정치 외적 요소가 개입할 가능성이 크다는 추측을 가능하게 한다. 그것도 시간의 흐름에 따라 일관되게 변하는 요소.
그런 요소는 나도 여러가지로 생각해봤는데 아마도 라임에이드님의 말대로 민주화 운동 이후의 세대가 나이를 먹어 투표권을 획득하고 그 이전 세대가 죽어서 투표권을 상실하는 것이 제일 유력할 듯 하다. 그것을 보여주기 위해선 추가적인 증거들이 필요할 것 같다. 예를 들면 세대별 투표율 자체가 시간에 따라 큰 변화가 없다든지 하는 자료. 선관위 홈페이지에선 자료를 못찾겠는데 누가 알려주시면 한 번 분석을 해볼 수 있을 듯. 어쨌든 20대 투표율이 낮다는 건 빼도박도 못하는 사실이니 이 분석으로 더 알려지는 건 없겠다. 오히려 투표율 저하의 원인을 정확히 알 수 있으면 좋은 일이다.
정치학 쪽에는 뭐 더 맞춤한 분석 기법이 있을지도 모르겠는데 일단 정리하자면 이상과 같다.
회귀분석은 독립변수들로부터 종속변수를 예측하는 통계분석의 일종이다. 이것은 무엇을 중심으로 보느냐에 따라 여러가지로 활용할 수 있다. 이미 정리된(또는 정리했다고 생각하는) 논점이지만 이번 총선 투표율이 저조한 이유는 민주화 이후 급격한 투표율 감소의 결과일 수도 있고 최근의 노무현 정권과 민주당의 정치적 실패로 인한 정치적 의사표현의 포기일 수도 있다. 당장 가진 자료만으로는 어느쪽인지 알 수 없다. 내가 민주화 이후 투표율 경향에서 투표율을 회귀분석한 이유는 민주화 이후 투표율 감소 경향을 통계적으로 통제해서 최근의 정치적 사건들이 투표율에 미친 영향을 알아보기 위해서다. 그래프를 보면 잘 드러나지만 2004년 총선은 투표율 자체는 1996년보다 낮지만 감소 경향을 고려하면 오히려 대단히 높다는 것을 알 수 있다. 올해 총선에서는 그런 차이가 나타나지 않는다. 따라서 분석 결과만 놓고 말한다면 올해 총선의 낮은 투표율이 민주당의 정치적 실패에서 비롯된 것이라고 보기는 어렵다.
그래프 자체를 이해하기는 썩 어렵지 않은데 아마도 로그승산(logit)과 가변수 회귀분석 때문에 정통고품격서비스님이 잘못 이해하신 모양이다. 회귀분석은 많은 경우 y = a + bx 꼴의 직선의 방정식 형태를 사용한다. 물론 y가 종속변수고, x가 독립변수. 여기에는 여러가지 이유가 있는데 일일이 설명하긴 어렵고 하옇든 그렇다.
그런데 투표율은 0%~100% 사이의 값이기 때문에 직선의 방정식에 적합(fitting)시키면 독립변수가 일정 범위를 넘어가면 투표율이 마이너스가 되거나 100%를 넘어버리게 된다. 그래서 투표율을 로그승산이라는 형태로 변형을 시킨다. 어떤 확률 p에 대해 로그 승산은 log( p / (1-p) )인 값을 말한다. 결과적으로는 아래와 같은 꼴의 곡선에 적합시키는 것과 같다.

그 다음에 elecP와 elecR. 이건 가변수(dummy variable)라고 한다. elecP는 대선, elecR은 지방선거. 총선을 기준으로 해서 대선과 지방선거라는 '종류'가 얼마나 영향을 미치는지 알기 위해 넣은 변수다. 총선의 경우는 elecP와 elecR을 모두 0으로하고 대선은 elecP만 1, 지방선거는 elecR만 1로 설정하면 선거의 종류에 따른 투표율의 변화를 알 수 있다.자세한 설명은 생략한다고 했지만 그래프를 봐도 알 수 있고 본문에 써놨듯이 대선이 총선에 비해 약 0.691이 일관되게 높다. 그러니까 정통고품격서비스님이 생각하는 것처럼 0.691과 대선의 투표율을 곱하는 게 아니고 대선 여부를 나타내는 변수를 곱하는 것이다. 대학에서 배우는 통계 기법 중에 '분산분석'은 컴퓨터가 나오기 전에 회귀분석을 계산하기 복잡해서 사용하던 방법으로 실제로는 회귀분석에서 가변수를 사용하는 것과 똑같다.
내가 처음부터 자세한 설명을 생략한다고 했을 때는 다 이유가 있었다. 배보다 배꼽이 더 크다.
그 외의 댓글에 대한 대답. 8비트 소년님은 시간에 따라 투표율이 떨어지는 건 현상일 뿐 시간의 흐름 자체가 투표율 저하를 설명할 수 없다고 말하셨는데 그건 경우에 따라 다르다. 이 분석에서 특기할 점은 시간의 흐름이 투표율 저하를 대단히 많이 설명한다는 사실이다. 연도와 선거의 종류가 종속변수의 분산을 약 93% 설명한다. 일반적으로 사회과학에서 이만큼 높은 수치가 나오는 경우가 거의 없다. 2004년 총선에서도 알 수 있듯이 투표율은 분명히 선행하는 정치적 사건으로부터 영향을 받는다. 그 영향의 크기를 정확히 알 수는 없지만 정치적 사건이 일정한 간격으로 나타나는 것도 아닌만큼 시간의 흐름에 따라 투표율이 일관되게 감소하긴 어렵다. 다른 국가의 투표율을 보면 예를 들어 미국의 경우 베트남전 시기를 전후해서 투표율이 많이 떨어졌다. 따라서 시간의 흐름에 따라 투표율이 일관되게 떨어진다면 정치 외적 요소가 개입할 가능성이 크다는 추측을 가능하게 한다. 그것도 시간의 흐름에 따라 일관되게 변하는 요소.
그런 요소는 나도 여러가지로 생각해봤는데 아마도 라임에이드님의 말대로 민주화 운동 이후의 세대가 나이를 먹어 투표권을 획득하고 그 이전 세대가 죽어서 투표권을 상실하는 것이 제일 유력할 듯 하다. 그것을 보여주기 위해선 추가적인 증거들이 필요할 것 같다. 예를 들면 세대별 투표율 자체가 시간에 따라 큰 변화가 없다든지 하는 자료. 선관위 홈페이지에선 자료를 못찾겠는데 누가 알려주시면 한 번 분석을 해볼 수 있을 듯. 어쨌든 20대 투표율이 낮다는 건 빼도박도 못하는 사실이니 이 분석으로 더 알려지는 건 없겠다. 오히려 투표율 저하의 원인을 정확히 알 수 있으면 좋은 일이다.
정치학 쪽에는 뭐 더 맞춤한 분석 기법이 있을지도 모르겠는데 일단 정리하자면 이상과 같다.
# by | 2008/04/15 23:33 | 잡담 | 트랙백(1) | 덧글(21)





☞ 내 이글루에 이 글과 관련된 글 쓰기 (트랙백 보내기) [도움말]
제목 : [아이추판다 트랙뷋] 통계의 의미
알기 쉽게 쓰는 것이 혁명이요 민주화라는, 이상한 전.....more
연도 보다는 님도 언급하셨듯이 선행하는 정치적 사건이라는 변수를 넣는게 훨씬 정치한 분석이 될 것 같습니다. 계량화가 불가능하다고요? 그래도 연도는 아니죠. 방사성 원소 반감기 재는 것도 아니고.
시간 자체를 독립적 변수로 사용하지 않을 이유도 없고, 시간이 흐른다고 해서 투표율이 안 줄어들 이유도 없습니다.
정치적 사건이라면 이미 주관성을 담보한 건데 이걸 회귀분석에 집어넣으신다라.
다소 어이가 없네요 -_-
정치적 사건을 회귀분석 변수로 이용하는 것도 쉬운 일은 아닌데 어떤 사건이 일어났느냐 안 일어났느냐 정도로 사용할 수 있지 않을까요? 제말은 연도로 분석하는 거 보단 차라리 낫지 않을까하는 얘기였습니다.
예를 들어 한국인의 평균수명과 연도의 상관관계를 분석하면 시간이 흐를수록 평균수명이 늘어나겠죠. 하지만 시간의 흐름자체가 평균수명 증가원인이 아니잖아요. 그러면 보건위생이 뭔 필요가 있겠습니까.
xacdo // 다른 블로그에서 찾은 자료가 있는데 곧 결과를 올려보겠습니다
그 주장에 대한 근거로 위의 분석을 제시한 거고요.
하지만 그것이 한국에서의 민주주의가 정상적으로 발전하고 있다는 주장의 근거는 될 수는 없다고 보여집니다. 투표율의 하락은 여러가지 요소에 의해 이루어질 수 있습니다. 민주주주의 지속적 발전(동의하지는 않지만)때문일 수도 있고, 87년 이후 지속적인 GDP의 증가 때문일 수도 있습니다. 또 매번 다른 요인의 중첩에 의해 이루어진 투표율 하락이 우연히 위와 같은 추세를 보인 것일 수도 있습니다.
즉, 이번 투표율에 대한 판단의 문제를 얘기하면서 아이츄판다님은 훨씬 큰 논제를 제기한 셈입니다. '한국에서의 민주주의의 발전'이라는 문제.
한국에서 민주주의는 정상적으로 발전하고 있다. 민주주의가 발전하면 투표율은 지속적으로 하락한다. 이 두 명제에 동의하는 사람이라면 아이츄판다님이 제시한 논거가 당연한 것이겠지만, 그렇지 않은 사람에게 위 논거는 전혀 딴 얘기만 하고 있는게 됩니다.
http://www.mediamob.co.kr/instincts/frmView.aspx?cate=8761&id=202346
까막 // 별 말씀을
悟汪 // 그렇지 뭐.
nixity // 네 그렇습니다.
저는 그 추세가 나타나는 이유를 설명할 수 있어야 한다 내지는 추세 자체가 정상적인게 아니라는 것이었구요. 이거 제가 연목구어를 좀 심하게 한거 같습니다. 보는 관점이 완전히 달라서 토론은 되지 않겠군요.
==>> 이것 때문에 문제가 생긴 것이겠지요. 민주주의가 잘 정착된 국가의 투표율이 낮은 건 사실이지만 투표율이 낮은 것이 민주주의가 잘 정착된 것의 지표라고 보기는 어렵다, 라든가 민주주의가 잘 정착된 나라라고 해도 투표율이 낮은 것이 문제가 안된다고 보기는 어렵다, 라든가 하는 문제제기가 생기는 것이구요.
어쨌거나 결국 그다지 영양가있는 글들은 아니었어요. 쩝.
투표율이 낮은 것이 민주주의가 잘 정착된 것의 지표라고 보기는 어렵다, 라든가 민주주의가 잘 정착된 나라라고 해도 투표율이 낮은 것이 문제가 안된다고 보기는 어렵다, 라든가 하는 문제제기가 일어나는 게 이 글을 영양가 없게 만든다고 봅니다.
이처럼 전제를 뒤바꾸고,
현상을 지적한 글을 원인을 지적한 글로 보는 등의 오독으로 인해 논쟁이 커졌다고 봐요.
이걸 글쓴이 탓으로 할 순 없지요.
선거 관련 첫번째 글이 반어와 조소로 가득했는데, 그걸 표면 그대로 받아들여 이러쿵 저러쿵 논의가 안드로메다로 가는 게 코미디였습니다. 하하
문과 망신은 철학과가 다 시키네