Rosette 개체명 추출 시스템
고도의 언어 기술 및 베이시언 이론을 구사한 특정 어구의
검출•추출 시스템

REX의 언어 기술
REX는 전세계의 주목을 받고 있는 베이시언 이론 기반 모델을 이용해 방대한 코퍼스에서 패턴을 추출합니다. 이 패턴들은 REX의 언어 모델에 이미 프로그래밍되어 있기 때문에 사용자들은 패턴을 프로그래밍하거나 학습시킬 필요가 없습니다. 또한 새로운 언어 모델도 쉽게 REX에 대응시킬 수 있습니다.

[제품 도입 효과]
  • 수집한 정보의 개요를 순식간에 파악해 신속하게 처리
  • 특정 지역•인물•기업 등의 정보를 추출

이메일, 문서 파일, 또는 인터넷을 통해 입수하는 대량의 데이터를 처리하는 텍스트 분석에서는, 지명 등 특정 단어나 어구 등의 개체명을 추출, 분류할 때 신속하고도 정확한 텍스트 처리가 가능합니다.

Rosette® 개체명 추출 시스템(REX)은 베이시언 이론을 바탕으로 추출하고자 하는 단어의 “문맥 패턴”을 미리 학습시켜 추출하게 하는 시스템으로 정보검색, CRM, 비즈니스 인텔리전스 등의 어플리케이션에 사용됩니다.

추출 가능한 어구는 다음과 같습니다.

  • 고유 명사
    베이시언 이론을 바탕으로 추출해야 할 단어의 “문맥 패턴”을 미리 학습하여 추출
    예) 인명, 지명, 단체명 등
  • 특정 패턴의 어구
    주어진 정규 표현과 일치되는 패턴의 문자열을 추출
    예) 날짜와 시간, 전화번호, URL, 제품 모델명 등 
    사용자 정의의 패턴 추출도 가능
  • 용어 사전 (가제티아)
    사용자가 지정한 어구와 일치되는 것을 추출

출력 샘플 :