텍스트 추출 SDK 다큐엑스

기업 콘텐츠의 다양한 활용 및 관리를 위한
텍스트 추출 SDK

문서 홍수 속 텍스트 추출은 다큐엑스

다큐엑스(DocuX)는 기업에서 활용하는 다양한 문서 포맷 내 텍스트 및 주요 정보를 추출하여 문서 콘텐츠의 효과적인 활용과 관리를 지원하는 텍스트 추출 SDK(Software Development Kit)입니다. 다큐엑스를 기업의 제품에 적용하여 많은 양의 문서를 신속하게 검색하며 개인 정보 및 기밀 정보가 포함된 문서 유출을 사전에 방지할 수 있습니다. 문서 콘텐츠를 효율적으로 관리하면서 기업의 중요 자산의 안전한 보호를 시작해 보시기 바랍니다.

다큐엑스가 특별한 이유

다큐엑스는 검색어 추출을 요구하는 다양한 형태의 문서 포맷과 메일 검색 서비스에 적용하여 사용 가능합니다. 압축파일 내 문서 추출과 MS 문서 내 OLE* 추출 지원과 다양한 라이브러리 연동 방식을 통해 사용 확장성을 더욱 높였습니다. 차단 키워드 필터링을 통해 안전한 문서 추출이 가능하며 안전하게 개인 및 기업의 정보자산을 보호할 수 있습니다. 무분별한 텍스트 추출을 방어하고 안전하고 신속한 텍스트 정보 추출을 수행해 보시기 바랍니다.

  • 텍스트 및 정보 추출
    문서 내 텍스트 및 속성 정보,
    문서 포맷 정보 추출
  • 다양한 포맷 지원
    압축파일, MS 문서, 문서 내 이미지 등
    다양한 형식 포맷 지원
  • 입/출력 인코딩 지원
    문서 인코딩 분석 및 추출
    텍스트의 인코딩 처리 지원
  • 확장성 높은 연동
    실패 파일 연동방식 및 API 제공으로
    라이브러리 연동 지원

*OLE(Object Linking and Embedding, 개체 연결 및 삽입) : 서로 다른 응용 프로그램에서 쓰는 고유의 형태를 유지한 채 다른 프로그램에서 불러와 삽입하여 쓸 수 있는 기능

다큐엑스 차단 키워드로 누리는 안전한 보안생활

다큐엑스는 텍스트 필터링에 특화되어 방대한 문서와 다양한 포맷들 속에서도 원하는 키워드에 속한 내용을 신속히 추출할 수 있습니다. 무엇보다 기업의 중요 정보 자산의 검색을 차단할 수 있어 심각한 기업 내부 정보 유출에 대응하도록 합니다. 기업이 가장 많이 사용하는 이메일과 문서작업에 필수적인 텍스트 검색 기능으로 기업에서 사용하는 다양한 콘텐츠 관리에 효과적으로 활용해 보실 수 있습니다.

  • 텍스트 필터링 특화
    검색/포털/메일/문서 등 텍스트
    추출이 필요한 다양한 분야 적용
  • 개인 정보 및 문서 보안
    개인 정보와 기밀정보 포함된
    문서 유출 방지
  • 이메일 검색/관리
    이메일 본문 및 첨부파일 내
    특정 키워드 정보 검색 차단 관리
  • 빠른 검색 서비스
    검색 서비스 내 문서 파일 인식
    및 추출 색인 시 활용
  • 기업 콘텐츠 관리
    문서 텍스트 추출로 효과적인
    콘텐츠 활용
  • 다양한 파일 포맷
    기업 주요 포맷 기능 지원
    다양한 OS 및 플랫폼 지원

다큐엑스가 궁금하신가요?

편하신 방법으로 문의하세요!