두고보자이상한 기관의 J씨만큼은 아니더라도 세상에 이상한 사람은 많다. 뭐 성격 자체가 이상한 건 그렇다치더라도 기본이 없어서 이상하게 된 사람들을 용서가 안된다. 대학원 다니면서 통계를 경시하고 고상하게 앉아서 '이론질'만 하려고 한 사람들은 졸업하고 석사니 박사니 해도 기본기가 없으니까 뭐 하나를 해도 제대로 하는 게 없다.
예전에 어느 회사에서 받은 데이터를 처리해준 적이 있다. 이 회사 쪽 '연구원'들은(연구는 개뿔..) 나름 석사를 받았다고 자기들 입으로 맨날 말은 하는데 도대체 대학원에서 뭘 배웠길래 데이터 하나 제대로 정리해서 보낼 줄 모른다. 예를 들어 여러 사람에게 키, 나이, 몸무게 뭐 이런 자료들을 측정했다고 해보자. 그럼 이 자료는 컴퓨터에 어떻게 입력해야 할까? 뭐 복잡하게 생각할 것도 없이 아래와 같은 형태가 될 것이다.
번호,이름,주민등록번호,나이,키,몸무게,
1,김개똥,xxxxxx-xxxxxxx,18,180,70
2,최말숙,xxxxxx-xxxxxxx,16,160,60
...
그런데 이 회사에서 보내온 데이터를 보니..
1, 김개똥, xxxxxx-xxxxxxx, 18, 키, 180
1, 김개똥, xxxxxx-xxxxxxx, 18, 몸무게, 70
2, 최말숙, xxxxxx-xxxxxxx, 16, 키, 160
2, 최말숙, xxxxxx-xxxxxxx, 16, 몸무게, 60
...
정상적인 형태로 했으면 6M 밖에 안되었을 데이터가 덕분에 100M가 넘었다. 용량만 커지는게 아니라 데이터 분석 자체가 불가능해서 정상적인 형태로 바꿔주는 프로그램을 만들어 변환을 했다. 그런데 얼마전 추가분석을 의뢰해오면서 데이터를 어떻게 정리해야 하냐고 물어보는 것이다. 어떻게 정리하긴 뭘 어떻게 정리해. 그런 당연한 걸 물어보면 좀 화나지. 일일이 설명해주다간 나만 피곤할 것 같아서 이미 만들어둔 프로그램으로 변환하면되니까 "그냥 저번에 했던 그대로" 보내달라고 했다. 그런데, 추석이라 할 일도 없고 메일로 온 자료를 프로그램에 넣고 변환을 하니 컴퓨터가 뻗어버렸다. 파일을 열어보니...
1, 18, 키, 180, 김개똥, xxxxxxxxxxxxx
1, 18, 몸무게, 70, 김개똥, xxxxxxxxxxxxx
2, 16, 키, 160, 최말숙, xxxxxxxxxxxxx
2, 16, 몸무게, 60, 최말숙, xxxxxxxxxxxxx
아 놔 열 순서는 왜 바꿨냐고. 또 주민번호 사이에 -도 살짝 빼준 센스는 또 뭔지. "그때 그대로"란게 무슨 말인지 이해 못하나, 앙? 프로그램에서 열 순서만 고쳐주면 되지만 거참 황당하네.