Rosette 개체명 추출 시스템
고도의 언어 기술 및 베이시언 이론을 구사한 특정 어구의
검출•추출 시스템
검출•추출 시스템
[제품 도입 효과]
|
이메일, 문서 파일, 또는 인터넷을 통해 입수하는 대량의 데이터를 처리하는 텍스트 분석에서는, 지명 등 특정 단어나 어구 등의 개체명을 추출, 분류할 때 신속하고도 정확한 텍스트 처리가 가능합니다.
Rosette® 개체명 추출 시스템(REX)은 베이시언 이론을 바탕으로 추출하고자 하는 단어의 “문맥 패턴”을 미리 학습시켜 추출하게 하는 시스템으로 정보검색, CRM, 비즈니스 인텔리전스 등의 어플리케이션에 사용됩니다.
추출 가능한 어구는 다음과 같습니다.
- 고유 명사
베이시언 이론을 바탕으로 추출해야 할 단어의 “문맥 패턴”을 미리 학습하여 추출
예) 인명, 지명, 단체명 등 - 특정 패턴의 어구
주어진 정규 표현과 일치되는 패턴의 문자열을 추출
예) 날짜와 시간, 전화번호, URL, 제품 모델명 등
사용자 정의의 패턴 추출도 가능 - 용어 사전 (가제티아)
사용자가 지정한 어구와 일치되는 것을 추출
출력 샘플 :

