그림으로 보는 통계: (1) 쥐와 사람의 관계
그림으로 보는 통계: (2) 쥐는 살찌고 사람은 굶는다
대망의 마지막 회. 일단 베이즈 볼 계산법의 주문을 다시 외어보자. "하얀 원으로 연결되면 관련이 있고, 까만 원으로 연결되면 관련이 없다. 머리-대-머리면 반대." 이번에는 반대의 경우인 '머리-대-머리'를 살펴보겠다.
초가집이 있다. 쥐가 이 집 기둥뿌리를 갉아먹을 수도 있고, 기둥이 썩을 수도 있다. 이 둘은 서로 관련이 없다. 쥐는 기둥뿌리가 썩건말건 갉아먹을 수 있고, 기둥도 쥐가 갉아먹든 말든 썩을 수 있다. 그리고 쥐가 갉아먹어서건 기둥이 썩어서건 아니면 둘 다 때문이건 그렇게 되면 집이 무너질 수 있다.
집이 무너질 수 있다고 해도 여전히 쥐가 기둥을 갉아먹는 것과 기둥이 썩는 것 사이에는 서로 관련이 없다. 이제까지와는 반대로 관찰되지 않은 변수가 머리-대-머리로 연결하는 경우에는 서로 관련이 없는 것이다.
그런데 추석을 맞아 버려두고 온 고향 옛집에 가봤다고 하자. 가보니 집이 무너졌든 아니면 멀쩡하든 집의 상태가 일단 관찰되면 쥐가 기둥 갉아먹는 것과 기둥이 썩는 것은 이제 관련이 있게 된다.
집이 무너졌다고 해보자. 무너진 집을 조사해보니 쥐가 갉아먹은 흔적이 발견된다면 집이 무너진 이유는 이것으로 설명되기 때문에 기둥이 썩었을 가능성은 낮아진다. 기둥이 썩은 게 발견되어도 마찬가지다. 말이 되는 것 같기도 하고 안되는 것 같기도 하다. 그럼 구체적인 수를 가지고 생각을 해보자.
어느 폐촌에 초가집 1000채가 있다. 이중에 20%인 200채는 쥐가 기둥뿌리를 갉아먹는다. 역시 20%인 200채는 기둥이 썩었다. 4%인 40채는 기둥이 쥐가 갉아먹은데다가 썩기까지 했다. 그림으로 보면 아래와 같다.
쥐가 기둥을 갉아먹은 집 200채를 조사해보면 그 중에서 기둥도 썩은 집은 40채(20%)다. 쥐가 기둥을 갉아먹지 않은 집 800채를 조사해보면 그 중에 기둥이 썩은 집은 160채(20%)다. 그러니까 쥐가 갉아먹든 말든 기둥이 썩은 집은 늘 20%인 것이다. 쥐가 기둥을 갉아먹든 말든 기둥이 썩는 것과 관련없다는 건 이 말이다.
그럼 이제 집이 무너지는 경우를 생각해보자. 쥐가 기둥을 갉아먹은 집이 무너질 확률은 50%다. 기둥이 썩은 집도 50%다. 그러니까 각각 160채 중에 80채가 무너진다. 기둥이 썩은데다 쥐가 갉아먹기까지 했으면 무너질 확률은 80%다. 이런 집은 40채가 있으니 32채가 무너진다. 마지막으로 멀쩡한 집도 640채 중엔 10%인 64채가 무너진다. 이제 무너진 집만 그려보면 아래와 같다.

이제 무너진 집 256채만 놓고 보자. 이 중에 기둥이 썩은 집은 112채(=32+80)다. 따라서 어떤 집이 무너졌을 때 기둥이 썩어있을 확률은 112/256 = 약 44%다. 그러데 무너진 집을 조사해보니 쥐가 갉아먹은 흔적을 발견했다고 해보자. 아까는 기둥이 썩을 확률이 20%면 쥐가 갉아먹든 말든 20%였다. 그런데 집이 무너진 경우엔 다르다. 쥐가 갉아먹은 집은 112채 중에 기둥도 썩은 집은 32채이므로 확률은 32/112 = 약 29%가 된다. 그리고 쥐가 갉아먹지 않은 집 144채(=80+64) 중에 기둥이 썩은 집은 80채이므로 확률은 80/144 = 약 56%가 된다. 즉, 집이 무너진 것이 관찰된 경우에는 쥐가 갉아먹었느냐 마느냐에 따라 기둥이 썩어있을 가능성이 달라지는 것이다.
이제까지 살펴본 베이즈 공 계산법을 이용해서 좀 더 복잡한 경우를 다뤄보자. 배우자가 수상한 행동을 하는 것이 관찰되었다. 배우자가 바람이 났을 수도 있고, 사실은 외계인이었을 수도 있다. 배우자가 외계인이라면 한밤 중에 집에 UFO가 찾아올 지도 모른다. 이걸 그래프 모형으로 그리면 아래와 같다.
그럼 베이즈 공 계산법 "하얀 원으로 연결되면 관련이 있고, 까만 원으로 연결되면 관련이 없다. 머리-대-머리면 반대."에 따라 배우자가 바람난 것과 UFO가 집에 찾아오는 건 관련이 있게 된다. 따라서 배우자가 바람을 피우는 게 확실하다면, 우리는 한밤 중에 UFO가 찾아올 것을 걱정하지 않고 편안히 잠들 수 있다.

그림으로 보는 통계: (2) 쥐는 살찌고 사람은 굶는다
대망의 마지막 회. 일단 베이즈 볼 계산법의 주문을 다시 외어보자. "하얀 원으로 연결되면 관련이 있고, 까만 원으로 연결되면 관련이 없다. 머리-대-머리면 반대." 이번에는 반대의 경우인 '머리-대-머리'를 살펴보겠다.
초가집이 있다. 쥐가 이 집 기둥뿌리를 갉아먹을 수도 있고, 기둥이 썩을 수도 있다. 이 둘은 서로 관련이 없다. 쥐는 기둥뿌리가 썩건말건 갉아먹을 수 있고, 기둥도 쥐가 갉아먹든 말든 썩을 수 있다. 그리고 쥐가 갉아먹어서건 기둥이 썩어서건 아니면 둘 다 때문이건 그렇게 되면 집이 무너질 수 있다.

그런데 추석을 맞아 버려두고 온 고향 옛집에 가봤다고 하자. 가보니 집이 무너졌든 아니면 멀쩡하든 집의 상태가 일단 관찰되면 쥐가 기둥 갉아먹는 것과 기둥이 썩는 것은 이제 관련이 있게 된다.

어느 폐촌에 초가집 1000채가 있다. 이중에 20%인 200채는 쥐가 기둥뿌리를 갉아먹는다. 역시 20%인 200채는 기둥이 썩었다. 4%인 40채는 기둥이 쥐가 갉아먹은데다가 썩기까지 했다. 그림으로 보면 아래와 같다.

그럼 이제 집이 무너지는 경우를 생각해보자. 쥐가 기둥을 갉아먹은 집이 무너질 확률은 50%다. 기둥이 썩은 집도 50%다. 그러니까 각각 160채 중에 80채가 무너진다. 기둥이 썩은데다 쥐가 갉아먹기까지 했으면 무너질 확률은 80%다. 이런 집은 40채가 있으니 32채가 무너진다. 마지막으로 멀쩡한 집도 640채 중엔 10%인 64채가 무너진다. 이제 무너진 집만 그려보면 아래와 같다.

이제 무너진 집 256채만 놓고 보자. 이 중에 기둥이 썩은 집은 112채(=32+80)다. 따라서 어떤 집이 무너졌을 때 기둥이 썩어있을 확률은 112/256 = 약 44%다. 그러데 무너진 집을 조사해보니 쥐가 갉아먹은 흔적을 발견했다고 해보자. 아까는 기둥이 썩을 확률이 20%면 쥐가 갉아먹든 말든 20%였다. 그런데 집이 무너진 경우엔 다르다. 쥐가 갉아먹은 집은 112채 중에 기둥도 썩은 집은 32채이므로 확률은 32/112 = 약 29%가 된다. 그리고 쥐가 갉아먹지 않은 집 144채(=80+64) 중에 기둥이 썩은 집은 80채이므로 확률은 80/144 = 약 56%가 된다. 즉, 집이 무너진 것이 관찰된 경우에는 쥐가 갉아먹었느냐 마느냐에 따라 기둥이 썩어있을 가능성이 달라지는 것이다.
이제까지 살펴본 베이즈 공 계산법을 이용해서 좀 더 복잡한 경우를 다뤄보자. 배우자가 수상한 행동을 하는 것이 관찰되었다. 배우자가 바람이 났을 수도 있고, 사실은 외계인이었을 수도 있다. 배우자가 외계인이라면 한밤 중에 집에 UFO가 찾아올 지도 모른다. 이걸 그래프 모형으로 그리면 아래와 같다.


- 끝 -
감사합니다
감사합니다





덧글
2편까지는 어케 따라왔는데 3편은 다시 한번 읽어봐야겠네요. ㅜ.ㅜ
이 모형들은 실생활에 잘 만 응용하면 꽤 쓸모가 많을 것 같은데, 응용방법을 또 한참 고민해야 겠네요. orz
정말 재미나게 잘 봤습니다.
전 배우자가 없으므로 UFO가 찾아올 것을 걱정하지 말고 편히 자면 되겠군요!(먼산)
11이 아니라 112 입니다. ^^;
고쳤습니다, 감사합니다 ^^
http://media.daum.net/foreign/view.html?cateid=1046&newsid=20091001150607325&p=seoul