태그 : LDA 요약보기전체보기목록닫기

1

텍스트의 통계학: (3) 네 주제를 알라

텍스트의 통계학: (1) 구글신의 새 마음텍스트의 통계학: (2) 셰익스피어의 영혼은 몇 그램?지난 번에는 간단하게 단어의 순서, 즉 문법을 통계적으로 분석하는 방법을 알아보았다. 제대로 문법을 분석하려면 일단 문법 이론부터 설명해야하니까 그건 과감하게 넘어가겠다. 원래 이 연재가 좀 수박 겉핥기다.이번에는 텍스트의 '주제'를 통계적으로 파악하는 방...

이글루스 5월의 떡밥들

텍스트 처리에 사용하는 인공지능 알고리듬을 이용해 지난 5월 한 달동안 이글루스에서 어떤 이야기가 오고갔는지 정리해보았다. 우선 간단한 로봇을 만들어 이글루스 뉴스밸리에 5월 한 달동안 올라온 포스트들을 수집했다. 삭제된 포스트, 폐쇄되거나 주소가 변경된 블로그, 외부 블로그는 제외했다.먼저 전체적인 통계를 보자. 수집된 포스트는 모두 5,731개로 ...
1



검색

맞춤검색

메모장

야후 블로그 벳지