"순이라는 사람 알아?"
"철수 친구 순이?"
"아니 요순시대 순임금"

이게 바로 현대 언어처리의 맹점이다.

일부러 말이 이어지게 썼지만 일반적인 상황이라면, 판단이 안 될 때 사람은 '순이'냐 '순'이냐를 먼저 되묻게 마련이다.

그러나 Siri가 반문하는 일은 없다. 자연어처리는 통계와 기계학습을 전제로 하기 때문에 무조건 하나의 답을 정한다. 사람이 임의로 반문의 논리를 구현해 넣어야만 무엇을 모르고 있는 지 확인한다.

내가 지금의 언어처리 기술을 단지 재미로 쓰는 서비스로 평가하는 이유다. 지금의 기술 방향은 아무리 연구해도 사전과 추론 규칙이 늘어날 뿐 본질이 발전하지는 못 할 것이다. 아무리 많은 컴퓨터공학 박사를 뽑아놔봐야 인지과학에 투자하지 않으면 기술은 제자리다.

이게 바로 R&D를 Research and Development로 보는 회사와 Research for Development로 보는 회사의 차이. 몇몇 국내 대형 기업의 얘기다.
  • 조은경김세원장유식님 외 3명이 좋아합니다.
  • 장유식 옳다. 인지과학에 투자하지 않으면 제자리
  • 조은경 지금의 인지과학도 들여다보면 한계가 있을 것... 컴공이냐 인지과학이냐로 나누기보다 interaction을 하고 그리하여 발전적인 반문이 나오게 하는 research for developing 이 필요한 것 같아... 사람은 반문을 자꾸 해도 싫어하잖아... 그래서 언어처리가 어려운 이슈인 듯 해... 처리로 끝낼지 소통을 위한 처리를 할지 이것부터 돌이켜 봐야하고....
  • 조은경 그리고 또 하나. 지금 저 대화에서 화자 청자간에 지시 대상 표현 방식에 좀 인지적인(?) 규칙이 있는데... 상대방이 알아듣기 용이한 공통된 맥락. 상황이란 게 있고 어떤 대상 표현을 해야 하거든. 가령 요순시대 임금을 잘 알아차리게 하려면 먼저 화제 제시하는 화자가 어느 정도 맥락을 줘야 하지... ㅎ
  • 조은경 그리고, 나는 언어학자이기도 하면서도 기계 학습을 사용하기를 좋아하거든... 사람(인지학자,언어학자,기타 연구자)이 인지적인 머리로 생각해낼 수 있는 언어학적 규칙은 그리 많지 않고, 언중은 우리가 인지적으로 설정해둔 언어적 규칙에 잘 따라주지도 않잖아.. 그래서, 언중들이 마구 뿜어낸 말뭉치에서 어느 정도의 규칙(?), 경향을 추출해내는 정도에서 기계학습,통계를 사용하면 좋은 것 같아.. 그리고.. 요즘 기계학습 방식 중에는 결정적이지 않은 것도 있더라.. ㅎㅎ 암튼, 자연어 처리(?)를 하려면 이것 저것 다 해봐야 하지 않나 생각...^^
  • 조은경 이 멍멍이 같은 페북은 포스트 share 기능은 넣어놓고 댓글은 같이 안가준다.. ㅠㅜ
  • Kay Park 장유식 너네 회사 힘내라. 지금 바닥이 넘 좁다. 
    조은경 누나가 할 말이 참 많은 분야죠 후배들 좀 컴공으로 많이 보내주세요 ㅎㅎ



Trackbacks  | Comments