Rosette 영어 분석 시스템효과적인 영어 형태소 정보 분석
영어에는 특이한 스펠링과 사용법을 가지는 외래어나 신어 등 방대하고 다양한 어휘가 포함되기 때문에 분석을 하기가 쉽지 않습니다. 또 "be", "have", "do" 등의 조동사는 문장에 따라 조동사로 판단되는 경우와 동사로 판단되는 경우가 있어 분석 작업을 더욱 복잡하게 만듭니다.
Basis Technology 의 Rosette® 영어 분석 시스템은 이를 효과적으로 해결하는 고성능 언어 분석 엔진입니다. 어간 추출 및 품사 해석 등의 정교한 영어 형태소 분석을 수행하는 이 엔진은 대용량 정보 분석/처리를 목표로 하는 모든 어플리케이션과 통합 구현할 수 있도록 고안되었습니다.
특징
- 정규화
단축형의 스펠아웃•분할, 토큰의 대문자를 소문자로 변환합니다.
- 기본화•어간 추출
접사를 삭제하고 단어를 원형 또는 기본형으로 변환합니다.
예) Walked → Walk
예) Went → go
예) their → they
- 품사 판별
명사, 고유명사, 동사, 형용사 등의 품사를 정확히 판별합니다.
