글로벌 경영 환경에서는 외국에서 자국어로 작성된 문건들이 법정 소송 사건의 중요한 정보가 됩니다. 국경을 넘어서 국제 법적 분쟁이 빈번해짐에 따라, 법조팀들은 외국어로 작성된 수천 개의 관련 자료 및 문건을 처리해야 할 상황에 직면해 있습니다.
이처럼 외국어 디지털 증거개시(E- Discovery)의 중요성이 높아지면서 법조팀과 기술 지원팀들의 새로운 대응 또한 요구되고 있습니다. 방대한 기업 문건을 분석 및 산출하는 고도로 복잡한 과정인 전자증거개시(e-discovery)는 외국어 자료 범위 처리로 그 영역을 확대함에 따라 그 처리과정은 한층 더 복잡해집니다. 소송 분쟁의 성패를 좌우하는 치밀한 자료 조사의 중요성은 그 어느 때보다 더욱 더 높아졌습니다.
법률팀 및 지원 부서에게 희소식
Basis Technology의 전자증거개시(E-Discovery) 시스템 소프트웨어는 법조계가 국면하고 있는 이 ‘다국어 증거 개시’라는 과제를 효과적으로 해결할 수 있도록 돕습니다. 또한 세계 유수의 다국어 검색 엔진 및 정보 검색 응용프로그램의 핵심 기술로 이미 도입된 바 있는 Basis의 최첨단 언어분석 소프트웨어는 테라바이트에 달하는 방대한 분량의 비정형 다국어 자료로부터 신속, 정확하게 비용효과적으로 전자증거개시(E-discovery) 구현을 가능케합니다.
Basis의 다국어 전자 증거개시(E-Discovery)시스템 소프트웨어는 수백 개의 기업 및 정부 기관에 도입되 그 성능이 입증된 바 있는 로젯 언어 플렛폼 RLP(Rosette Linguistics Platform)를 기초로 하고 있으며 최상의 호환성을 자랑하는 RLP 소프트웨어 컴포넌트들이 검색 워크플로우 및 정보 검색 응용프로그램과 연계되어 다국어 인코딩 및 데이터 자료를 처리하여 다국어 분석 전자증거개시(E-discovery)의 토대를 이루고 있습니다.
다국어 지원으로 확대되는 전자증거개시(E-Discovery)
업계 선도의 Basis 언어 분석 소프트웨어는 데이터 마이닝, 검토분석 및 법조팀이 사용하는 다른 디스커버리 응용 프로그램과도 손쉽게 연동되는 장점을 가지고 있습니다. RLP API와 연동하여 디스커버리 사용자들은 유럽 언어 및 아시아, 중동어까지 지원하는 고유한 전자증거개시(E-discovery) 도구 세트를 바로 사용하실 수 있습니다. 이는 법률 팀이 다국어 연관 자료 검색 및 검토 과정을 통해 최상의 정확성과 효율성을 확보하게 됩니다.
1단계: 언어/인코딩 식별 및 유니코드 변환
사용 모듈: Rosette Language Identifier (RLI)
RLIs는 문서가 작성된 언어 및 인코딩을 감별하여 내용이 정확하게 필터링 및 처리할수 있게 해주며, 문서를 유니코드로 변환함으로써 어떠한 언어에 무관하게 단일 데이터 자료를 디스커버리 및 정보 검색 응용프로그램이 사용할 수 있게 됩니다. 로젯 언어경계 탐지기, RLBL(Rosette Language Boundary Locator) 기능을 사용하여 여러 외국어 문서를 지역별 언어에 따라 분절화하여 각기 다른 처리과정을 거칠수 있도록 합니다. RLI는 아주 짧은 길이의 문장이라도 고도의 정확도로 55여개의 언어 식별이 가능합니다.
2 단계: 단어 형태, 품사 및 문장 구조를 분석하는 언어학적 인공지능
사용 모듈: Rosette Base Linguistics (RBL)
문서에 대한 형태소 분석을 통해 RBL은 텍스트를 정확하게 필터링하고 분석 및 검색할 수 있게 해주며, 또한 유럽어, 아시아어 및 중동어 등등의 품사, 문장 나눔, 단어 분할, 토큰 등의 언어학적 요소들을 분석합니다. 10년여 이상의 인터넷 검색 엔진과 기업 검색 엔진의 발전 결과의 산물이 바로 RBL 의 기술 및 언어 데이터입니다.
3단계: 관심 항목 추출 (알려지지 않은 항목 포함)
사용 모듈: Rosette Entity Extractor (REX)
REX는 문서의 비정형 텍스트를 검사하여 인명, 지명, 날짜와 같이 향후, 문서 내용 분석을 돕는 요소를 식별합니다. REX는 일반 명사는 물론, 고유 명사, 전화 번호 그리고 e-메일 주소와 같은 사용자 항목을 찾아 찾아주며 통계적 모델링을 통해 REX의 변수 간의 위험이 있는 개연성 나열에 그치지 않고, 엔티티(Entity)가 문서 내에 있는 지를 식별합니다. 따라서 알고자 하는 질문에 대한 답을 제시할 뿐만아니라, 알지 못하던 것도 알려주는 뛰어난 엔티티(Entity)추출 기술 구현이 가능합니다.
Basis의 다국어 분석 E-Discovery 시스템 소프트웨어가 언어의 장벽을 넘어 성공적 국제소송분쟁에 승리할 수 있도록 돕겠습니다.
