"순이라는 사람 알아?"
"철수 친구 순이?"
"아니 요순시대 순임금"
이게 바로 현대 언어처리의 맹점이다.
일부러 말이 이어지게 썼지만 일반적인 상황이라면, 판단이 안 될 때 사람은 '순이'냐 '순'이냐를 먼저 되묻게 마련이다.
그러나 Siri가 반문하는 일은 없다. 자연어처리는 통계와 기계학습을 전제로 하기 때문에 무조건 하나의 답을 정한다. 사람이 임의로 반문의 논리를 구현해 넣어야만 무엇을 모르고 있는 지 확인한다.
"철수 친구 순이?"
"아니 요순시대 순임금"
이게 바로 현대 언어처리의 맹점이다.
일부러 말이 이어지게 썼지만 일반적인 상황이라면, 판단이 안 될 때 사람은 '순이'냐 '순'이냐를 먼저 되묻게 마련이다.
그러나 Siri가 반문하는 일은 없다. 자연어처리는 통계와 기계학습을 전제로 하기 때문에 무조건 하나의 답을 정한다. 사람이 임의로 반문의 논리를 구현해 넣어야만 무엇을 모르고 있는 지 확인한다.
내가 지금의 언어처리 기술을 단지 재미로 쓰는 서비스로 평가하는 이유다. 지금의 기술 방향은 아무리 연구해도 사전과 추론 규칙이 늘어날 뿐 본질이 발전하지는 못 할 것이다. 아무리 많은 컴퓨터공학 박사를 뽑아놔봐야 인지과학에 투자하지 않으면 기술은 제자리다.
이게 바로 R&D를 Research and Development로 보는 회사와 Research for Development로 보는 회사의 차이. 몇몇 국내 대형 기업의 얘기다.
이게 바로 R&D를 Research and Development로 보는 회사와 Research for Development로 보는 회사의 차이. 몇몇 국내 대형 기업의 얘기다.