2009/09/24 16:21

그림으로 보는 통계: (2) 쥐는 살찌고 사람은 굶는다 수학/통계학

그림으로 보는 통계: (1) 쥐와 사람의 관계

여러분의 열화와 같은(?) 성원에 힘입어 계속되는 연재(먼산). 오늘의 주제는 꼬리-대-꼬리(tail-to-tail) 연결이다. 어느 순간 사람들의 입에 오르내린 "쥐는 살찌고 사람은 굶는다"라는 표어를 생각해보자. 이 표어에서 사람이 굶는 건 쥐가 살찌기 때문이 아니다. 이 두 가지는 "쥐가 쌀을 축낸다"라는 동일한 원인에서 초래된 결과다.

다시 한 번 베이즈 공 계산법의 주문을 외워보자. "하얀 원으로 연결되면 관련이 있고, 까만 원으로 연결되면 관련이 없다. 머리-대-머리면 반대." 쥐가 쌀을 축낸다는 사실이 관찰되기 전에는 "쥐가 살찐다"와 "사람이 굶는다"는 통계적으로 관련이 있다.

쉽게 말해 여러 분이 어느 집에 갔는데 포동포동 살찐 쥐를 보았다고 해보자. 그러면 이 집 사람들은 굶주리고 있을거라고 추론해보는 것도 무리가 아니다. 물론 이 집이 부자집이라 쥐가 쌀독에 대운하를 파도 쌀이 넉넉하다면야 쥐가 살쪄도 사람은 굶지 않을 것이다. 언제나 그렇지만 논리학과 달리 통계학에서는 이럴 수도 있고 저럴 수도 있다. 하지만 그런 불확실성을 잘 '길들이는' 것이 통계학에서는 관건이 된다.

그럼 이제 쥐가 쌀독에 들어앉아 소중한 쌀을 쳐묵쳐묵하고 있는 장면을 목격했다고 하자.

그럼 이제 "쥐가 살찐다"와 "사람이 굶는다" 사이에는 관련이 없게 된다. 이것은 앞의 글에서 다룬 "머리-대-꼬리"와 같은 이유다. 간단히 말해 "쥐가 쌀을 축낸다"는게 목격된 이상 쥐가 살찌건 말건 사람이 굶는다는 사실에는 변함이 없게 되기 때문이다.

이것만으로는 좀 싱거우니까 이런 아이디어가 실제 통계분석법에서 어떻게 나타나는지 잠깐 살펴보자. 시험 점수를 바라보는 관점에는 두 가지 편향이 있다. 하나는 시험 점수가 그 자체로 실력을 반영한다고 보는 관점이고, 또 하나는 시험 점수는 시험 점수일 뿐 실력이 아니라는 관점이다.

그런데 한 사람이 여러 번 시험을 보면 시험마다 점수는 다를지언정 대체로 관련이 있다는 걸 알 수 있다. 저번 시험에 80점 맞은 사사람은 이번 시험에서 75점이나 85점을 맞기도 하지만 그렇다고 30점을 맞는 경우는 드물다. 반대로 저번 시험에 50점을 맞은 사람이 갑자기 90점을 맞는 경우도 드물다. 오늘 소개한 꼬리-대-꼬리의 연결로 이를 모형화해보자.

우리는 어떤 경우에도 실력 그 자체를 관찰할 수는 없다. 우리가 관찰할 수 있는 것은 시험 점수들 뿐이다. 위의 모형에서 시험 점수들은 관찰되지 않은 변수인 '실력'에 의해 꼬리-대-꼬리로 연결되어 있으므로 서로 관련이 있게 된다. 이제 우리는 실제 자료를 가지고 그렇게 관련이 있는지 검증할 수 있다.

이런 논리에 바탕을 둔 통계 분석법을 "요인 분석(factor analysis)"이라고 한다. 요인 분석은 우리가 관찰할 수 있는 현상들 사이에 관찰할 수 없는 공통 원인이 있다고 가정한 다음, 그런 가정에 바탕해서 위와 같은 모형을 세우고 이를 검증하는 것이다.

요인 분석은 원래 스피어만이라는 심리학자가 일반 지능(general intelligence)의 존재를 검증하기 위해 만든 것이다. 스피어만은 여러 종류의 다른 시험 점수들 사이에 상관 관계가 나타나는 것을 보고, 서로 다른 종류의 지적 작업에 공통적으로 관여하는 일반 지능이 있다고 생각했다.

사람을 컴퓨터에 비교해서 설명하자면 그래픽 카드나 랜 카드 같은 것의 성능이 특수한 재능이고 CPU 성능이 일반 지능이 되는 것이다. 사실 CPU 성능도 정확하게 측정할 방법이 없기 때문에, 일반 지능도 확실하게 측정할 방법은 없지만 요인분석 등의 통계적 방법으로 대략 추정은 할 수 있다.

일반지능이론에 반대하는 다중지능이론이나 모듈론 같은 것도 있지만 스피어만의 이론은  오랫동안 많은 심리학자들이 지지해왔고 여전히 교육이나 인사 등 실무 영역에서는 널리 활용되는 개념이다. 스피어만 이후에 발전된 모형을 단순화시키면 아래와 같다.

물론 수학이나 과학시험도 언어능력의 영향을 받기는 하겠지만 그냥 간단히 그렸다. 미국의 수능인 SAT는 이런 지능 이론에 바탕을 둔다. 지능에는 크게 유동 지능(fluid intelligence)와 결정 지능(crystalized intelligence)이 있고, 유동 지능의 대표적인 것이 일반 지능이다. 결정 지능은 간단히 말해 경험적으로 축적된 지식을 말한다. 그래서 SAT 1은 유동 지능을 측정하는 검사로 언어영역과 수리영역, 에세이로 이뤄져있고, SAT 2는 결정 지능을 측정하는 검사로 과목별 지식을 측정한다. 한국의 수능도 SAT 1과 비슷한 구조를 가지고 있다. 수능에서 사회와 과학 시험을 좀 생뚱맞게도 "수리탐구2"라고 부르는 것은 이런 이유 때문이다.

다음은 대망의 "머리-대-머리" (계속)

핑백

  • Null Model : 그림으로 보는 통계: (3) 바람난 남편, 외계인 아내 2009-09-29 19:26:48 #

    ... 그림으로 보는 통계: (1) 쥐와 사람의 관계 그림으로 보는 통계: (2) 쥐는 살찌고 사람은 굶는다 대망의 마지막 회. 일단 베이즈 볼 계산법의 주문을 다시 외어보자. "하얀 원으로 연결되면 관련이 있고, 까만 원으로 연결되면 관련이 ... more

  • Null Model : 텍스트의 통계학: (1) 구글신의 새 마음 2009-10-05 19:32:49 #

    ... with PageRank. Psychological Science, 18, 1069-1076. 그림으로 보는 통계: (1) 쥐와 사람의 관계 그림으로 보는 통계: (2) 쥐는 살찌고 사람은 굶는다 그림으로 보는 통계: (3) 바람난 남편, 외계인 아내 ... more

  • 잠보니스틱스 : 오늘의 분방한 잡동사니 2009-11-08 09:55:36 #

    ... 쎈쓰! ★직장어 표준어 (이로동님) 제길 눈물 없이는 볼 수 없다 OTL ★이과생틱 개그 (yora님) 적재적소에 사용하면 생활의 활력소 ★그림으로 보는 통계: 01 | 02 | 03 (아이추판다님) 쉬운 설명과 절묘한 예시가 매력 ★미녀는 석류를 좋아해. (데프콘1님) 덧글과 같이 보면 더 재미있음 ★최근 이글루스에서 발견한 법칙들 ... more

덧글

  • aeon 2009/09/24 16:43 #

    잘 읽고 있습니다. 감사합니다!
  • 아이추판다 2009/09/24 20:52 #

    잘 읽으셨다니 저도 기쁘네요.
  • GQman 2009/09/24 16:52 #

    마지막 그림은 엑박...ㅠ
  • 아이추판다 2009/09/24 20:53 #

    확인해보니 링크는 문제 없는데 아마도 일시적인 문제가 아닐까합니다.
  • 실피드 2009/09/24 18:08 #

    우와~ 우와~ (성원을 보냅니다)
    쳐묵쳐묵.. 보니까 구뎅피 생각이 -_-;
  • 아이추판다 2009/09/24 20:53 #

    구뎅피.. 하하 ^^;
  • 아레스실버 2009/09/24 19:01 #

    지난 회의 마지막 도식을 상기하며 댓글을 답니다.
  • 아이추판다 2009/09/24 20:53 #

    아니 그렇게까지 하실 필요는.. 감사합니다 (넙죽)
  • 다라나 2009/09/24 19:14 #

    점점 흥미가 늘어가네요. 감사합니다.
  • 아이추판다 2009/09/24 20:54 #

    지루해지지 않을까 걱정했는데 다행이네요. 감사.
  • Raymundo 2009/09/24 19:29 # 삭제

    이번에는 그 도식이 없어서 댓글달 의욕이 감퇴...? ^^;;;

    막상 "쥐가 쌀을 축낸다"가 관찰되고 나면 그전에는 관련 있던 것이 이제는 관련없어진다는 것이 알 듯 말 듯 하네요. 말은 알겠는데 가슴으로 받아들이기 어렵달까...
  • 아이추판다 2009/09/24 20:54 #

    원래 통계가 좀 가슴으로 받아들이기 힘들죠. 누나 가슴에 삼천원쯤은 있는 거니까요.. (응?)
  • Carrot 2009/09/24 20:08 #

    참고로 수리탐구2는 이제 없어졌습니다.
    ...
  • 아이추판다 2009/09/24 20:55 #

    이름을 그냥 사탐/과탐으로 바꿨나보군요. 사실 과거 수탐2는 수리지능을 반영한다고 보기도 어려운 문제들이라서요.
  • Carrot 2009/09/24 20:56 #

    7차 교육과정 시작하면서 싸~악 바뀌었죠. 이과는 이제 사회과 과목을 시험보지 않고, 문과는 과학과 과목을 시험보지 않아요.
  • 언럭키즈 2009/09/24 21:15 #

    살찐 쥐를 봤다->쥐가 쌀을 축낼 가능성이 높다.->집 사람들이 굶고 있을 가능성이 있다.
    쥐가 쌀을 축 내고 있는 현장을 목격했다->쥐가 설사병에 걸려서 먹자마자 싸더라도 일단 쌀은 줄어든다.->쥐가 살이 찌던 말던, 집 사람들이 굶고 있을 가능성이 있다.
    대충 이렇게 정리하면 되는건가요?
    다음 포스팅도 기대하겠습니다.
  • 아이추판다 2009/09/24 21:36 #

    완벽한 정리입니다. ㄷㄷㄷ
  • 한단인 2009/09/25 09:46 #

    아.. 과연 이번 포스팅 제목을 기대하라고 하신 이유가 있군요. ㄷㄷㄷ
  • mike 2009/09/29 23:06 # 삭제

    "쥐가 살찐다" 와 "사람이 굶는다"는
    코릴레이션은 있되, 코잘리티는 없다. 이런식으로 생각하는 게 맞나요? 저는 저런 경우는 그렇게 생각했는데
  • 아이추판다 2009/09/29 23:22 #

    상관은 있지만 직접적인 인과관계는 없는 게 대체로 저렇게 관찰되지 않은 공통 원인이 있는 경우죠.
  • 기은이 2009/12/15 06:30 # 삭제

    잘 읽고 갑니다 ^ ^ 요인분석 하는 이유를 잘 알것같아요
※ 이 포스트는 더 이상 덧글을 남길 수 없습니다.



검색

맞춤검색

메모장

야후 블로그 벳지