Rosette Unicode 대응 라이브러리
어떠한 언어 정보 처리도 가능케하는 유니코드화 구현

Basis Technology의 Rosette® 유니코드 대응 라이브러리(RCLU: Rosette Core Library for Unicode)를 이용함으로써 소트프웨어 어플리케이션의 다국어 처리를 가능케 해주는 유니코드화를 빠르고 효과적으로 구현할 수 있습니다.

Basis Technology의 Rosette® 유니코드 대응 라이브러리는 최신 Unicode 표준에 준거하여 UTF-16, UTF-7, UTF-8 및 Unicode 구 버전, 국제적으로 사용되고 있는 160종류 이상의 인코딩을 지원하기 때문에 사용 환경에 적합한 인코딩으로 입출력이 가능합니다.

한국에서는 EUC-KR, ISO-2022-KR 등 한국 고유의 인코딩을 이용한 데이터 처리가 필요한 경우가 많습니다. RCLU는 한국어 고유 인코딩으로부터 유니코드로 변환, 그리고 유니코드에서 한국어 인코딩으로의 변환 툴로도 사용할 수 있습니다.

한국어•일본어•중국어의 인코딩 자동 판별, 텍스트 문자열의 정규화 및 자소 분별 또한 가능케 합니다.

한국어 텍스트에 지원되는 주요 문자열의 정규화 기능은 다음과 같습니다.

문자열 변환 기능

  • 한글 음절 문자(Hangul syllable)를 한글 자모(Hangul Jamo)로 분해
  • 한글 자모열을 한글 음절 문자로 변환
  • 한글 호환(compatible) 자모를 한글 자모로 변환
  • 반각(半角) 한글 문자를 한글 자모로 변환
  • 역슬래쉬 기호를 원화 기호(\)로 변환
  • 원화 기호(\)를 역슬래쉬 기호로, 오버바를 틸드 기호로 변환
  • 알파벳 대문자를 소문자로, 소문자를 대문자로 변환
  • 숫자열을 라틴 문자(ASCII문자)의 숫자로 변환
  • SGML 문자 요소를 유니코드로 변환
  • 지정된 문자 속성의 문자를 삭제
  • 지정된 문자 속성의 문자만 남기고 다른 문자는 삭제
  • 개행, 패러그래프 구분의 코드를 정규화

중국의 한자 인코딩 GB18030와 유니코드 상호 인코딩 변환도 가능합니다. GB18030(GBK2K)는 중국의 정보 처리 제품에 사용이 의무화되어 있는 국가 표준 인코딩입니다.


Basis Technology 는 Unicode Consortium의 회원 기업입니다.