식대장이랑 대화하면서 문득 알았다.

단어의 문맥적인 의미 해석은
Word Sense Disambiguation 과 완전히 동일한 문제라는 걸.

'백설공주의 사과'와 '아침엔 사과'의 <사과>가
동일한 단어이면서 문맥적으로 다른 사과인데
어떻게 분석할 것이냐는

'Sorry 사과'와 'Apple 사과'를 구분하는 것과 완전히 같다.
그저 사전 안에서 항목이 더 생기는 것 뿐이다.

'백설공주의 사과'는 나쁜 사과이고
'아침엔 사과'는 좋은 사과를 말한다.

우리는 사전에 항목을 상당히 많이 만들어야 한다.
지금은 과일 사과와 미안한 사과만 있지만
독사과, 몸에 좋은 사과, 싸게 파는 사과, 확성기 트럭이 와서 파는 맛 좋은 꿀사과 등...

그리고 학습 데이터를 거기에 맞춰 구축하면 된다.
100년쯤 걸리겠지.

여튼 그러면 된다.
별로 큰 문제가 아니었다.
훗.



Trackbacks  | Comments