지식체계의 발견

사람의 뇌/마음은 긴 진화 과정을 통해 만들어진 것이다. 진화는 거대한 설계 아래 이뤄지는 것이 아니라 그때 그때 땜질처방식으로 이뤄지기 때문에 그 결과물은 아이팟보다는 천테이프가 덕지덕지 붙은 덜컹거리며 돌아가는 낡은 기계에 가깝다. 따라서 마음에 대한 우아한 이론을 만든다는 건 여러모로 불가능에 가깝다.

이 문제를 '우아하게' 공략하는 한 가지 방법은 실제의 마음 대신 마음이 진화한 목적을 묻고 그 질문에 바로 대답하는 것이다. 진화심리학에서 하는 방식이 대체로 이렇다. 진화심리학이 심리학계 바깥에까지 인기(?)를 얻고 있는데는 이런 탓도 좀 있다.

"확률론적 모델링"은 진화심리학 못지 않게 우아한 또다른 접근법이다. 마음은 불확실한 세계 속에서 정보들을 수집하고 통합해서 적절한 판단과 결정을 내려야 한다. 이런 것을 연구하는 학문이 통계학인데 그렇다면 마음의 목적과 통계학의 목적은 비슷하다고 말할 수 있다. 이런 관점에서보면 마음의 문제를 통계학적 문제로 바꿔서 풀어본다면 마음이 어떻게 작동하는지에 대해 실마리를 얻을 수 있을 것이다.

이런 관점에서 연구하는 심리학자들이 적지 않다. MIT의 조슈아 탄넨바움, 런던대학의 닉 차터, UCLA의 앨런 유일, UC버클리의 토마스 그리피스, CMU의 찰스 켐프 등등. 이 접근법의 장점은 심리학 연구도 되고 통계학 연구도 되어서 꿩도 먹고 알도 먹는다는 것이고, 단점은 이게 심리학 연구인지 통계학 연구인지 좀 오락가락 한다는 것이다.

스탠포드의 레라 보로디츠키는 유명한 물리학 농담을 인용하면서 이 접근법을 비판한다. 어느 농부가 농장의 문제를 해결하기 위해 물리학자에게 자문을 구했는데 몇 달 뒤에 이 물리학자가 가져온 해결책은 이렇게 시작했다. "소가 구라고 가정하자.."

소가 구라고 가정하는 것이 이 접근법의 장점이자 단점이라고 할 수 있겠는데 하여간 심리학으로서는 어쩔지 몰라도 통계학 또는 인공지능 연구로서는 분명한 가치가 있다. 원래 이쪽이야 소는 늘 구니까. 올해 PNAS에 실린 켐프와 탄넨바움의 논문은 이 접근법의 장점을 확실히 보여준다.

지식의 체계에는 다양한 것들이 있다. 동물은 계문강목과속종으로 분류할 수도 있고, 크기 순으로 배열할 수도 있으며, 사는 지역에 따라 구분할 수도 있고, 먹고 먹히는 관계로 생각할 수도 있다. 우리는 자료들을 가지고 이 자료에 적절한 체계를 발견하고 이 체계에 맞추어 자료를 분석한다. 보통 통계학에서 하는 부분은 뒷부분, 자료분석부터다. 켐프와 탄넨바음은 이 앞부분까지 통계학적 문제로 한번 다뤄보자는 것이다.

켐프와 탄넨바움의 아이디어를 간단히 설명하면 이렇다. 다양한 체계들은 그래프로 나타낼 수 있다. 여기서 그래프는 막대 그래프, 원그래프할 때 그 그래프가 아니고 흔히 말하는 네트워크를 가리킨다. 이런 그래프들은 아래 그림처럼 단순한 과정을 반복해서 만들어낼 수 있다.

이 과정을 간단히 설명하면 이렇다. 데이터는 부분으로 쪼개거나 각 부분을 이어 관계를 표시하는 것을 반복해서 그래프로 만들 수 있다. 이런 쪼개기와 잇기의 과정에 베이지언 통계학을 접목시켜서 데이터를 더 잘 설명하는 방향으로 그래프를 자꾸 그려나가다보면 결국엔 데이터를 가장 잘 설명하는 그래프를 얻을 수 있다. 정말일까?

켐프와 탄넨바움은 이 과정을 컴퓨터 프로그램으로 만들어 실제 데이터를 입력해서 아래와 같은 결과들을 얻어냈다. A는 동물의 생물학적 정보를 넣은 결과다. 동물들이 우리가 하는 것처럼 계문강목과속종과 같은 나무 형태로 분류된 것을 볼 수 있다. B는 미국의 연방대법원 판사들의 판결 정보를 넣은 결과다. 역시 우리가 하는 것처럼 좌우로 정렬되는 걸 볼 수 있다. C는 색상들을 넣은 건데 뭐 당연히 색상환을 찾아낸다. 이외에도 다른 예들이 있으나 생략.


통계적으로 분석한다면 A는 위계적 군집분석, B는 1차원 척도법, C는 딱히 맞는 게 없는데 하옇든 각각 다른 방법을 사용해야 한다. 켐프와 탄넨바움의 프로그램은 이런 방법 자체를 데이터로부터 결정하는 것이다. 사람들이 실제로 머리 속에서 그래프 이론과 베이지언 통계를 가지고 계산하는 것은 아니지만 켐프와 탄넨바움의 요지는 '마치 그렇게 계산이라도 하는 것처럼' 생각한다는 것이다.

블로그 이웃 중에 한 분이 통계를 위험하게 사용하는 사람들에 대한 글을 쓰셔서(링크는 생략) 이 논문이 떠올랐다. 심리학은 통계학 빼면 시체인데 심리학자 중엔 스피어만처럼 자기 데이터를 분석할 통계방법이 없어서 요인분석을 창시한 사람이 있는가하면, 그 후대에는 죽어라고 배리막스 회전만 하는 사람도 있다. (요인분석은 연구목적에 따라 회전방법을 선택해야 하는데 통계 프로그램의 기본 옵션이 배리막스 회전이라 그냥 그걸로 하는 사람들이 좀 많다. --;)

심리학 아니라도 자기 데이터 어떻게 분석해야할지 몰라서 우왕좌왕하는 사람들이 제법 있는데 켐프와 탄넨바움의 연구는 닥치고 데이터만 넣어주면 나머진 컴퓨터가 다 알아서 한다는 거니까 우왕ㅋ굿ㅋ라고 할 수 있다. 물론 전문적인 통계분석을 대체할 수준은 아니지만 앞으로 이런 연구가 계속되면 정말로 그렇게 되겠다. 그런데 그렇게 되면 이런 사람들의 존재의의가 뭔지 좀 의심스러워지긴 한다. (지금도 의심스럽지만)

참고문헌
Kemp, C. & Tenenbaum, J. B. (2008). The discovery of structural form. Proceedings of the National Academy of Sciences, 105(31), 10687-10692. http://www.pnas.org/content/105/31/10687

by 아이추판다 | 2008/12/08 02:03 | 트랙백 | 핑백(1) | 덧글(20)

트랙백 주소 : http://nullmodel.egloos.com/tb/1845361
☞ 내 이글루에 이 글과 관련된 글 쓰기 (트랙백 보내기) [도움말]
Linked at Null Model : 공간을.. at 2009/07/11 15:34

... 한국어니 걱정말고 클릭!)에서 피아제의 연구와 후속 연구들을 소개한 적이 있다. 푸앵카레와 피아제에서 이어지는 연구의 한 사례를 보자. 아래 그림은 예전에도 한 번 소개했던(지식체계의 발견) 탄넨바움과 켄트의 논문에서 가져온 것이다. 단순한 조작을 통해 partition, chain, order, ring, hierarchy, tree, grid, cyl ... more

Commented at 2008/12/08 04:08
비공개 덧글입니다.
Commented by 아이추판다 at 2008/12/08 10:29
듣고보니 포스팅꺼리가 또 하나 생각나네요. vision 쪽이야말로 모델링의 황금광맥이라..
Commented by 성큼이 at 2008/12/08 10:12
와 재밌는 연구결과네요. 링크 신고합니다.
Commented by 아이추판다 at 2008/12/08 10:30
감사합니다
Commented by Semilla at 2008/12/08 10:17
뭐 통계학 가르칠 심리학 교수 찾는 광고는 불황 중에도 계속 되는 것 같던데요....
Commented by 아이추판다 at 2008/12/08 10:30
'이런 사람들'(=자기 데이터 어떻게 분석해야할지 몰라서 우왕좌왕하는 사람들) 덕분이죠. ^o^
Commented by 새벽안개 at 2008/12/08 11:47
ㅎㅎ 이러다간 심리학이 새로운 인식론으로 자리잡겠습니다.
Commented by 아이추판다 at 2008/12/08 16:27
콰인이 비슷한 얘길 한 바 있죠.
Commented by 지나가다 at 2008/12/08 15:58
머릿글에 진화->낡은기계->우아함불가 의 논법을 썼는데 잘 이해가 가지 않네요.
사람의 눈도 진화의 결과인데 눈이 아이팟보다 정교하지 못하거나 이해하지 못할 결과인가요?

덕지덕지 땜질된 것은 유전자이고 그 결과물인 생명체는 정교하고 우아하다고 생각합니다. 그리고 진화라는 것은 땜질식으로 이루어지는 것이 아닙니다. 그것은 진화의 작은 일부분입니다. 오히려 용불용설이 땜질에 가깝겠지요. 님의 말대로 땜질이라면 원숭이가 사람 되는것도 시간문제겠군요.
Commented by 아이추판다 at 2008/12/08 16:25
다음 논문을 참고하세요. Jacob, F. (1977). Evolution and Tinkering. Science, 196(4295). 1161-1166.
Commented by joyce at 2008/12/08 17:16
오~ 세상의 모든 데이터를 집어 넣으면 학문들이 알아서 나올 수도 있겠군요.
Commented by 아이추판다 at 2008/12/08 18:00
그때면 인공지능이 사람을 앞지르는 날이 되겠죠.
Commented by Frey at 2008/12/08 21:47
이건 상당히 좋아보이는데요; 저도 나중에 통계를 좀 써봐야 할 것 같은데 통계는 1학년 기초 통계 수준밖에 모르다 보니 (...)
Commented by 아이추판다 at 2008/12/08 23:05
통계는 독특한 논리가 있어서 한 번 리듬을 타면 머리에 쏙쏙 들어오는 데 반대로 한 번 늪에 발을 들이면 헤어나오질 못하죠. ^^
Commented by Bloodstone at 2008/12/08 22:33
역시 심리학이라는 학문은 인간을 연구하다 보니, 여러 가지의 모델들을 사용하는군요. 읽을 때마다 공부하고 가게 됩니다. 정말 매력적인 학문인 것 같네요^^;
Commented by 아이추판다 at 2008/12/08 23:05
감사합니다
Commented by _yosm at 2008/12/08 22:52
안녕하세요. 구독한지는 꽤 됐는데 이제야 신고합니다.. ^^;
여기서 그래프 그려주고, 다음에 무리까지 나눠주면 편리하겠구나 싶은데말이죠..
근데, 소와 물리학자 이야기 뒤는 어떻게 되나요? 뒤가 궁금한데요..

Commented by 아이추판다 at 2008/12/08 23:09
무리로도 나누죠. A에서 분기점이 무리에 해당합니다. 소와 물리학자 얘기는 저게 끝이에요. 불가능한 걸 가정한다고 놀리는 농담이죠. ^^;;
Commented by albireo at 2008/12/09 11:36
network theory의 관점에서도 무척 흥미로운 연구네요. +_+
Commented by adnoctum at 2009/01/30 22:02
흥미있는 내용이군요. 근데 결국 'feature matrix'를 만드는 문제가 관건이 되겠네요. 논문에선 structure라고 표현하긴 했는데 결국은 node간의 거리에 관계된 문제인 것으로 보입니다. 예를 들어 pedigree를 그냥 원형으로 그린다면 가까운 곳에 위치해야 할 노드들이 쫙 퍼져버리니까 tree 형태로 그리는 것보다는 안 좋게 나오겠죠.

그리고 답글 중에 'Evolution and Tinkering. Science' 이 논문이요, Natural Selection 까지 읽어 보았는데, 이 논문을 읽고 할 수 있는 생각은 개인에 따라 아이추판다님이 글 첫머리에 쓴 글과는 다를 수 있을 것 같다는 생각이 듭니다. 제 개인적으로는 진화가 오해받고 있는 것 중 하나가 '진화의 가속도'를 0 으로 보는 것이 아닌가 합니다. 뭐 항상 0 보다 큰 건 아니지만 진화는 때때로 가속이 붙는 것 같거든요.

블로그의 글 재미있게 잘 읽고 있습니다.

:         :

:

비공개 덧글

◀ 이전 페이지          다음 페이지 ▶