2009/12/14 19:22

하나로 끝: 매우 적은 표본에 기반한 최적 의사결정 수학/통계학

현장의 의학[공학]이 과학인가? (漁夫님)

우리가 살아가는 세계는 불확실성으로 가득차 있고, 학문의 목적에 따라 불확실성을 다루는 방법은 달라진다. 과학과 같이 정확한 지식을 얻는 것이 목적일 경우에는 당연히 가능한 많은 데이터를 바탕으로 체계적인 이론을 수립해야한다. 과학에서 데이터는 많을 수록 좋다. 반면, 의학이나 공학처럼 투입 대비 산출이 중요한 학문의 경우 적어도 '현장'에서는 데이터가 많은 것이 항상 바람직하지는 않다. 데이터를 구하는 과정 또한 비용이기 때문이다. 그렇다면, 투입 대비 산출이 중요한 상황에서 데이터는 얼마나 많은 것이 '최적'일까?

확률론의 오랜 전통에 따라 이야기는 동전 던지기 도박으로 시작한다. 돈을 걸고 동전을 던져서 어느 면이 나올지 맞추면 돈을 따는 도박이 있다. 이 동전은 꼭 공평한 건 아니어서 어느 한쪽면이 더 많이 나올 수도 있고 그렇지 않을 수도 있다. 대신 돈을 걸기 전에 동전을 마음껏 던져볼 수 있다. 그러면 몇 번이나 던져보는 게 좋을까? 통계학적 표현을 쓰자면 몇 개의 표본을 추출하는 것이 최적일까?

동전을 많이 던져보면 많이 던져볼 수록, 앞면과 뒷면이 나올 확률을 더 정확히 알 수 있다. 하지만 여기서 목적은 동전의 앞뒷면이 나올 확률을 알아내는 게 아니라, 그저 돈을 따는 것이므로 무한정 동전을 던질 필요는 별로 없다. 어떤 사람이 한 번만 동전을 던져서 앞면이 나오면 앞면에 걸고, 뒷면이 나오면 뒷면에 걸기로 했다고 해보자. 만약 이 동전이 한쪽면만 100% 나오는 동전이라면 이렇게만 해도 이 사람은 무조건 돈을 딸 수가 있다. 또 앞뒷면이 공평하게 50%씩 나오는 동전이라면, 50%의 경우에 돈을 딸 수 있다. 동전을 아주 많이 던져서 정확한 확률을 알아봤자 전자의 경우엔 역시 100% 딸 수 있고, 후자의 경우에도 역시 50%밖에 딸 수 없다. 그러니 이 두 가지 경우엔 동전을 한 번만 던져보든, 천 번을 던져보든 돈을 딸 수 있는 확률은 똑같다.

만약 앞면은 75%, 뒷면은 25% 나오는 동전이라고 해보자. 시험삼아 한 번 던져보면 역시 앞면이 75% 나올 것이다. 앞면에 돈을 걸면, 앞면이 나올 확률은 여전히 75%다. 이렇게 돈을 딸 확률은 75% × 75% = 56.25%다. 시험삼아 던졌을 때 뒷면이 나올 확률은 25%인데, 이때 뒷면에 걸어서 또 뒷면이 나올 확률은 25%이므로 이렇게 돈을 딸 확률은 25% × 25% = 6.25%다. 두 경우의 확률을 더하면 62.5%가 된다. 동전을 많이 던져서 75%라는 걸 정확히 알았다면 무조건 앞면만 걸테니 75% 돈을 땄겠지만 그보다는 12.5%나 돈을 덜 따는 것이다.

이런 식으로 표본의 수에 따라 돈을 딸 확률을 구할 수 있는데, 이것을 동전의 앞뒷면이 나올 확률을 알고 있을 때 내릴 수 있는 최적의 의사결정과 비교해서 그래프로 그린 것이 아래 그래프이다.

이 그래프를 보면 동전의 앞뒷면이 나올 확률에 따라 얼마나 많은 표본을 추출해야 최적에 가까운 의사결정을 내릴 수 있는지 알 수 있다. 하지만, 우리는 동전을 던져보기 전에는 동전의 어느 면이 나올 확률을 알 수 없고, 따라서 동전을 얼마나 던져보고 결정을 내리는 게 좋은지도 알 수가 없다. 다시 원점이다.

그러나 위의 그래프에서 보듯이 동전의 확률이 어떻든지 한 번만 미리 던져봐도 최적의 경우와 비교해서 많이 차이나봐야 돈을 딸 확률은 12.5% 밖에 차이가 나지 않는다. 이걸 그래프로 표현한 것이 아래 그림이다. 왼쪽의 그래프에서 점선은 최적의 경우와 비교할 때 평균적인 차이고, 실선은 가장 큰 차이다. 오른쪽은 표본을 하나 더 추출했을 때 돈을 딸 확률이 증가하는 정도를 나타낸 것이다.



다시 말해 한 번만 던져봐도 아예 안 던져보는 것보다는 돈을 딸 확률이 훨씬 높아진다. 그리고 동전을 많이 던지면 던질 수록 그 확률이 늘어나긴는 하지만 0번 던지는 경우와 1번 던지는 경우의 차이보다 더 크게 늘어나진 않는다. 여기서 "시간은 금"이라는 격언을 상기해보자. 쉬는 시간을 틈타 짤짤이를 하고 있는 고등학생이라면 선생님이 오기 전까지 어쨌든 한 푼이라도 더 따야 한다. 시험삼아 여러번 던진다면, 더욱 정확한 확률은 알 수 있지만 몇 판 못가 선생님이 '뜰' 것이다. 그렇다면 차라리 좀 덜 정확하더라도 여러 판 하는 편이 더 이익일 수도 있다. 게다가 판마다 동전이 바뀐다면, 미리 던져보느라 보내는 시간도 적지 않게 된다. 게다가 표본을 하나 더 추출할 때마다 돈을 딸 확률이 늘어나는 정도는 급격하게 감소한다. 그렇다면 주어진 시간에 돈을 최대한 많이 따기 위해 필요한 '최적'의 표본 수는 아래 그래프와 같이 나온다.




실선은 보상과 손실이 같은 경우(맞추면 따고, 틀리면 잃는다), 점선은 보상만 있고 손실은 없는 경우(맞추면 따지만, 틀리면 잃지 않는다)다. 후자의 경우 정보를 얻는 비용과 행동에 옮기는 비용이 1:1일 경우엔 아예 동전을 미리 던져볼 필요도 없다. 그 비용이 40:1이 될 때까지는 한 번만 미리 던져보는 것이 최적이다. 보상과 손실이 대칭적이라면 9:1까지는 한 번만 던져보는 것이 최적이다. 어느 쪽이나 비용이 1000대 1이 될때까지도 30번 이상 던질 필요가 없다. 간단히 말해:


노파심에 강조를 해두자면 여기서 가정하고 있는 것은 단순하면서도 극단적인 상황이기 때문에 현실적으로는 더 많은 정보가 필요하다. 또, 여기서 '최적'이라는 것은 산출을 최대화할 수 있다는 것이지 하나의 표본만으로도 정확한 지식을 얻을 수 있다는 의미가 아니다. 어쨌든 특정한 상황에서는 하나의 표본에 근거한 의사결정이 최적이라는 것은 조금 재미있는 결과다.

본문의 내용과 그래프는 Vul, E., Goodman, N. D., Griffiths, T. L., & Tenenbaum, J. B.(2009). One and done? Optimal decisions from very few samples. Proceedings of the 31st Annual Conference of the Cognitive Science Society.에서 인용한 것이다. 이 논문의 목적은 적은 경험만으로도 쉽게 결론을 내리는 사람들의 '성급한 일반화' 경향에 긍정적 측면이 있다는 것을 보여주기 위한 것이다. 이 논문의 1저자인 에드워드 불이 '부두 상관(Voodoo correlation)' 논쟁(연어와 fMRI)으로 올해 뇌과학계를 뜨겁게 달궜던 사람이라는 것을 생각해보면 아이러니가 아닐 수 없다.

핑백

덧글

  • aeon 2009/12/14 19:43 #

    간단히 줄이면 어떨 땐 어쨌거나 선택하는 게 좋다.. 인가요 ^^;
  • 아이추판다 2009/12/14 19:50 #

    간단히 줄이면 "질러라!"..라는 것이죠;; (짤방 추가했습니다 ㅋ)
  • aeon 2009/12/14 20:20 #

    아 명쾌한 한줄 요약... 아니 짤방 감사드립니다;
  • 거북거북 2009/12/14 20:33 # 삭제

    재; 재밌네요. 잘 읽고 갑니다. (__)
  • 아이추판다 2009/12/14 23:01 #

    감사합니다 (__)
  • asianote 2009/12/14 22:58 #

    기대효용이론과의 연관성이 있는듯 한데 정확하게 알지 못하겠네요.
  • 아이추판다 2009/12/14 23:08 #

    어떤 점이 그럴까요?
  • 오쫑 2009/12/15 02:29 # 삭제

    재미있게 읽었습니다 ^^
    항상 쉽고 재미있게 글을 쓰시는 판다님에게 감사하고 있습니다. (덕택에 공부도 많이 되구요 ^^)

    덧) 이러다가;; 판다님 팬클럽을 창단할 수도 (쿨럭;)
  • 아이추판다 2009/12/15 23:20 #

    하하;;
  • 漁夫 2009/12/15 09:58 #

    제 별 것 아닌 글이 이렇게 좋은 포스팅을 유발했군요. ^^;;
  • 아이추판다 2009/12/15 23:20 #

    저야 남의 논문 요약한 것 뿐인데요;;
  • 누렁별 2009/12/15 12:00 #

    "척 보면 앱니다"던 황기순씨가 생각나네요. "제한된 합리성"이 그럭저럭 작동한다고 보면 되나요.
  • 최종욱 2009/12/15 21:59 #

    그러고보니 인터뷰 문제도 비슷한 종류인 것 같은데, 이것보다는 그나마 쉬운 편인것 같습니다.
  • 한정호 2010/01/15 15:53 # 삭제

    트랙백 신고합니다.

    일선 현장에서 얼마나 한방의 문제가 심각한지 볼 수 있는 '재미난' 링크들입니다.

    저는 하루에도 몇명씩 이런 상담을 하고 살고 있답니다.... ^^;
※ 이 포스트는 더 이상 덧글을 남길 수 없습니다.



검색

맞춤검색

메모장

야후 블로그 벳지