2008년 10월 15일
아버지와 딸의 베이즈정리
이상한 홍준기에서부터 열심히 트랙백을 보내오는 분이 있다. 이 분은 내가 말한 다음 부분을 좀처럼 납득하지 못하고 있다.
저번에 아주 쉽게 설명을 해줬는데도 난독증이 있으신지 계속 고집을 부린다. 이 분은 내가 다음과 같은 추론을 거쳐서 위와 같은 주장을 한다고 말한다. 한숨만 나온다.
쉽게 설명을 해주면 더 못알아듣나? 아예 제대로 설명을 해보자. 이게 마지막이니까 눈 비비고 똑바로 읽도록. 먼저 기초부터. 조건부 확률이란 어떤 사건 B가 주어져있을 때 사건 A의 확률을 말한다. 이를 P(A|B)라고 쓴다. 예를 들어 흡연자의 50%가 폐암에 걸린다면 P(폐암|흡연)=0.5라고 쓴다. 조건부 확률을 구하는 공식은 간단하다. P(A|B) = P(A∩B)/P(B)이다.
P(A|B) = P(A∩B)/P(B)이고 P(B|A) = P(A∩B)/P(A)다. 두번째 식에서 P(A)를 좌변으로 넘기면 P(B|A)P(A) = P(A∩B)를 얻는다. 첫번째 식에서 P(A∩B)를 세번째 식으로 치환하면 P(A|B) = P(B|A)P(A)/P(B)라는 식을 얻는다. 이를 베이즈 정리라고 한다.
자, 이제 우리의 문제로 돌아와보자. 내가 한 말은 베이즈 정리를 이해한다면 어렵지 않다. P(A|B)가 큰 값이 되려면 P(B|A)가 크고, P(A)가 크고, P(B)가 작아야 한다. 여기까진 당연한 거고 그렇다면 내가 이상한 홍준기에서 한 말을 베이즈 정리로 옮겨 적어보자.
일단 히스테리에 걸린 여성들의 아버지 대부분이 병에 걸려야 한다는 것까지는 이해한 것 같다. 이 말은 P(아버지 중병|딸 히스테리)라고 표기할 수 있다. 다시 말해 우리가 히스테리에 걸린 딸을 관찰한다면 그 아버지는 높은 확률로 중병에 걸려있다는 것이다. 그러면 베이즈 정리를 적용해서 이 식을 전개해보자.
P(아버지 중병|딸 히스테리) = P(딸 히스테리|아버지 중병)P(아버지 중병)/P(딸 히스테리)
위의 식에서 P(아버지 중병)이 아버지가 병에 걸릴 확률이다. 원래 인용했던 홍준기의 글에서 "매력적인 남성의 구애를 뿌리치고"라는 대목에서 알 수 있듯이 여기서 말하는 딸들의 범위는 결혼적령기 딸들이고 따라서 여기서 말하는 아버지도 모든 아버지가 아니라 결혼적령기 딸들의 아버지다. P(아버지 중병)이 높다는 것은 해 결혼적령기 딸을 둔 아버지들이 중병에 걸릴 확률이 높다는 말이다. 이것이 "19세기말~20세기초 비엔나에 살던 결혼적령기 딸을 둔 남성들이 하나같이 중병에 걸려 병석에 누워있었거나"라는 말의 확률적 의미다.
사실 이렇게 길게 설명할 것도 없다. 히스테리 걸린 결혼적령기 딸들의 아버지는 결혼적령기 딸들의 아버지의 부분집합이므로 결혼적령기 딸들의 아버지들이 중병에 걸릴 확률이 높다면 별다른 이유가 없는 이상 자연히 히스테리 걸린 결혼적령기 딸들의 아버지도 중병에 걸릴 확률이 높아지게 된다.
이렇게까지 설명해줘도 이해 못하겠다면 나도 더 할 말이 없다.
히스테리에 걸린 여성들의 '대부분'이 아버지 병간호에 많은 시간을 보내려면 먼저 그 이전에 히스테리에 걸린 여성들의 아버지'대부분'이 병에 걸리지 않으면 안된다. .. 그렇다면 19세기말~20세기초 비엔나에 살던 결혼적령기 딸을 둔 남성들이 하나같이 중병에 걸려 병석에 누워있었거나 아니면 딸의 히스테리와 아버지의 발병 사이에 어떤 연관관계가 있어야 한다.
저번에 아주 쉽게 설명을 해줬는데도 난독증이 있으신지 계속 고집을 부린다. 이 분은 내가 다음과 같은 추론을 거쳐서 위와 같은 주장을 한다고 말한다. 한숨만 나온다.
전제1: 모든 히스테리 처자들의 아버지들(A)은 중병에 걸렸다(B)
전제2: 모든 히스테리 차자들의 아버지들(A)은 모든 결혼적령기의 처자들의 아버지들(C) 이다
결론: 따라서 (C)는 (B)이어야 한다.
전제2: 모든 히스테리 차자들의 아버지들(A)은 모든 결혼적령기의 처자들의 아버지들(C) 이다
결론: 따라서 (C)는 (B)이어야 한다.
쉽게 설명을 해주면 더 못알아듣나? 아예 제대로 설명을 해보자. 이게 마지막이니까 눈 비비고 똑바로 읽도록. 먼저 기초부터. 조건부 확률이란 어떤 사건 B가 주어져있을 때 사건 A의 확률을 말한다. 이를 P(A|B)라고 쓴다. 예를 들어 흡연자의 50%가 폐암에 걸린다면 P(폐암|흡연)=0.5라고 쓴다. 조건부 확률을 구하는 공식은 간단하다. P(A|B) = P(A∩B)/P(B)이다.
P(A|B) = P(A∩B)/P(B)이고 P(B|A) = P(A∩B)/P(A)다. 두번째 식에서 P(A)를 좌변으로 넘기면 P(B|A)P(A) = P(A∩B)를 얻는다. 첫번째 식에서 P(A∩B)를 세번째 식으로 치환하면 P(A|B) = P(B|A)P(A)/P(B)라는 식을 얻는다. 이를 베이즈 정리라고 한다.
자, 이제 우리의 문제로 돌아와보자. 내가 한 말은 베이즈 정리를 이해한다면 어렵지 않다. P(A|B)가 큰 값이 되려면 P(B|A)가 크고, P(A)가 크고, P(B)가 작아야 한다. 여기까진 당연한 거고 그렇다면 내가 이상한 홍준기에서 한 말을 베이즈 정리로 옮겨 적어보자.
일단 히스테리에 걸린 여성들의 아버지 대부분이 병에 걸려야 한다는 것까지는 이해한 것 같다. 이 말은 P(아버지 중병|딸 히스테리)라고 표기할 수 있다. 다시 말해 우리가 히스테리에 걸린 딸을 관찰한다면 그 아버지는 높은 확률로 중병에 걸려있다는 것이다. 그러면 베이즈 정리를 적용해서 이 식을 전개해보자.
P(아버지 중병|딸 히스테리) = P(딸 히스테리|아버지 중병)P(아버지 중병)/P(딸 히스테리)
위의 식에서 P(아버지 중병)이 아버지가 병에 걸릴 확률이다. 원래 인용했던 홍준기의 글에서 "매력적인 남성의 구애를 뿌리치고"라는 대목에서 알 수 있듯이 여기서 말하는 딸들의 범위는 결혼적령기 딸들이고 따라서 여기서 말하는 아버지도 모든 아버지가 아니라 결혼적령기 딸들의 아버지다. P(아버지 중병)이 높다는 것은 해 결혼적령기 딸을 둔 아버지들이 중병에 걸릴 확률이 높다는 말이다. 이것이 "19세기말~20세기초 비엔나에 살던 결혼적령기 딸을 둔 남성들이 하나같이 중병에 걸려 병석에 누워있었거나"라는 말의 확률적 의미다.
사실 이렇게 길게 설명할 것도 없다. 히스테리 걸린 결혼적령기 딸들의 아버지는 결혼적령기 딸들의 아버지의 부분집합이므로 결혼적령기 딸들의 아버지들이 중병에 걸릴 확률이 높다면 별다른 이유가 없는 이상 자연히 히스테리 걸린 결혼적령기 딸들의 아버지도 중병에 걸릴 확률이 높아지게 된다.
이렇게까지 설명해줘도 이해 못하겠다면 나도 더 할 말이 없다.
# by | 2008/10/15 01:41 | 트랙백(1) | 덧글(5)





☞ 내 이글루에 이 글과 관련된 글 쓰기 (트랙백 보내기) [도움말]
제목 : 100개체중 판다가 10%인데 그 중 90%가 아이..
판다님이 좀 흥분했다 보다. 이런 어색한 글도 다 쓰고. 사실 전에 포스팅한 종교적 감성으로서의 과학의 주제는 판다님의 예전 생태학적 오류지적이 아니었는데 본말이 전도된 느낌이다. 하지만 이것이 가장 마음에 걸린다면 무엇이 잘못되었는지 좀 더 확실하게 집고 넘어갈 필요는 있겠다. 판다님의 글 중 여기서 부터 시작하자 (파란색 글이 판다님의 말) 조건부 확률을 구하는 공식은 간단하다. P(A|B) = P(A∩B)/P(B)이다. 시작은 좋다. 좀 ......more
예를 들어, 19세기말 20세기초 비엔나에 살던 결혼 적령기 딸을 둔 남성이 100명이 있다고 가정 해보죠. 그리고, 히스테리에 걸린 여성이 총 10명이 있다고 가정하고, 그네들의 아버지들이 모두 중병에 결렸다고 해보죠. 그러면, 히스테리를 가진 여성의 아버지가 중병에 결렸을 확률은 100%입니다만, 결혼적령기의 딸을 둔 남성이 중병에 걸렸을 확률은 10%입니다. 따라서, 히스테리에 걸린 여성의 아버지가 대부분 발병했다고 해서, 딸의 히스테리와 아버지의 발병 사이에 어떤 상관관계가 있다고 가정하는 것은 무리인 것 같습니다만...
예를 들어 1000명에 10명 꼴로 나오는 병이 있다고 쳐요. 그런데 100명이 사는 섬이 있어요. 그럼 그 섬에서 이 병이 생기는 사람은 몇 명이 나와야 할까요? 그런데, 의외로 이 섬 주민 모두가 발병자라면, 님은 이 섬의 환경이나 무엇인가와 이 병 사이에 상관 관계가 있다고 생각지 않으실 건가요?
아이추판다님의 결론은 두가지군요.
히스테리를 가진 여성과 그네의 아버지의 발병사이에는 상관관계가 있다.
만약 상관관계가 없으려면 결혼적령기의 딸을 둔 남성은 모두 발병했어야 한다.
저는 히스테리를 가진 여성의 아버지가 발병했다고 해서 결혼적령기의 딸을 둔 남성이 모두 발병하는 것은 아니라고 말씀드리고 싶었던 건데, 실수했습니다.