Rosette 한국어 형태소 분석 시스템

“중국어, 일본어, 한국어판의 검색 엔진을 전개하기 위해 Google은 Basis Technology의 언어 기술을 이용했습니다.”


Google
Fellow and Vice President,
Urs Hölzle



[제품 도입 효과]
  • 검색 시스템의 키워드 추출 정확도를 개선

한국어는 음운과 자모를 조합하는 표기 형식이기 때문에 형태소 분석을 하는 데 있어 해결해야할 문제들이 많습니다. 특히 단어의 경계 식별을 컴퓨터로 처리하는 것이 어려운데 당사의 Rosette® 한국어 형태소 분석 시스템은 한국어 텍스트의 분절을 처리하는 데 대단히 뛰어난 능력을 발휘합니다.

Rosette® 한국어 형태소 분석 시스템은 한국어 텍스트의 정확한 분절을 신속하게 처리하기 위해 통계적인 기법을 사용하고 있으며 또 상세한 사전을 기준으로 하고 있습니다. 통계적인 기법에는 단어의 빈도에 관한 정보, 어형 변화의 법칙을 반영했으며 사전 데이터는 정기적으로 갱신하고 있습니다.