메인 콘텐츠로 건너뛰기

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

이 섹션에서는 ABBYY FineReader Engine의 가장 일반적인 사용 시나리오를 설명합니다. 먼저 작업에 가장 적합한 시나리오를 선택하여 ABBYY FineReader Engine 사용을 시작하는 것이 좋습니다. 적절한 시나리오를 찾았다면 기본 사용 시나리오 구현 섹션에서 해당 시나리오에 대한 자세한 설명, 구현 지침, 그리고 특정 작업에 맞게 코드를 최적화하기 위한 권장 사항을 확인할 수 있습니다.

문서 변환

intro_Scenarios_DocumentConversion

이 시나리오의 결과물은 문서의 편집 가능한 버전입니다.

이 시나리오에서는 문서 이미지를 인식하여 원본 서식을 그대로 유지하면서 데이터를 편집 가능한 파일 형식으로 저장합니다. 그 결과, 오류 확인 및 수정이 용이한 편집 가능한 문서 버전을 얻을 수 있습니다.

자세한 내용은Document Conversion을 참조하십시오.

intro_Scenarios_DocumentArchiving

이 처리 시나리오에서는 종이 문서를 모든 문서 정보를 검색 가능한 형식으로 포함하는 편집 불가능한 디지털 사본으로 변환합니다. 이러한 처리 결과로, 전자 아카이브에서 전체 텍스트 검색을 통해 문서의 디지털 사본을 쉽게 찾을 수 있으며, 문서 텍스트 세그먼트를 복사하거나 이메일로 전송하거나 인쇄할 수 있습니다.

자세한 내용은Document Archiving을 참조하십시오.

데이터 캡처

intro_Scenarios_DataExtraction

이 시나리오는 문서에서 가능한 모든 데이터를 추출해 구조화된 방식으로 저장하는 데 사용됩니다.

결과는 문서 구조를 나타내는 JSON 파일입니다. 여기에는 인쇄 텍스트와 손글씨 텍스트, 표, 바코드, 체크마크, 이미지와 해당 위치 및 특성 등 모든 문서 객체가 저장됩니다. 이 형식은 후속 처리, 데이터베이스 저장 또는 다른 애플리케이션과의 통합에 가장 적합합니다.

자세한 내용은Data Extraction을(를) 참조하세요.

intro_Scenarios_TextExtraction

이 시나리오를 사용하면 문서의 본문 텍스트는 물론 로고, 인장, 그리고 본문 이외의 요소에 포함된 텍스트도 추출할 수 있습니다.

텍스트의 자연스러운 순서, 즉 “사람이 읽는 방식”이 유지됩니다. 그런 다음 이 문서들을 사용자 측의 자연어 처리(NLP) 엔진에 입력해 예를 들어 빠르게 요약하거나, 민감한 정보를 검색하거나, 감성 분석을 수행할 수 있습니다.

자세한 내용은Text Extraction을(를) 참조하세요.

intro_Scenarios_FieldLevelRecognition

필드 수준 인식의 경우, 특정 fields에서 데이터를 캡처하기 위해 짧은 텍스트 조각을 인식합니다. 이 시나리오에서는 인식 품질이 매우 중요합니다.

이 시나리오는 문서에서 의미 있는 데이터를 추출해야 하는 더 복잡한 시나리오의 일부로도 사용할 수 있습니다(예: 종이 문서의 데이터를 정보 시스템과 데이터베이스에 입력하거나 Document Management Systems에서 문서를 자동으로 분류하고 인덱싱하는 경우).

이 시나리오에서 시스템은 일부 fields에 있는 여러 줄의 텍스트만 인식하거나 작은 이미지 전체의 텍스트를 인식합니다. 시스템은 인식된 각 문자에 대해 신뢰도 점수를 계산합니다. 그런 다음 이 신뢰도 점수를 인식 결과를 확인할 때 사용할 수 있습니다. 또한 시스템은 텍스트의 단어와 문자에 대해 여러 인식 후보를 저장할 수 있으며, 이는 인식 품질을 향상시키기 위한 보팅 알고리즘에 사용할 수 있습니다.

자세한 내용은Field-Level Recognition을(를) 참조하세요.

intro_Scenarios_BarcodeRecognition

이 시나리오에서는 ABBYY FineReader Engine을 사용해 바코드를 읽습니다. 예를 들어 문서를 자동으로 분리하거나, Document Management System에서 문서를 처리하거나, 문서를 인덱싱하고 분류하기 위해 바코드를 읽어야 할 수 있습니다.

이 시나리오는 다른 시나리오의 일부로 사용할 수 있습니다. 예를 들어, 고속 생산용 스캐너로 스캔한 문서는 바코드를 통해 분리할 수 있으며, 장기 보관용으로 준비된 문서는 바코드 값에 따라 보관용 Document Management Systems에 저장할 수 있습니다.

텍스트에서 바코드를 추출할 때 시스템은 모든 바코드를 감지하거나 특정 값의 특정 유형 바코드만 감지할 수 있습니다. 시스템은 바코드 값을 가져와 체크섬을 계산할 수 있습니다.

인식된 바코드 값은 후속 처리에 가장 적합한 형식으로 저장할 수 있으며, 예를 들어 TXT에 저장할 수 있습니다.

자세한 내용은Barcode Recognition을(를) 참조하세요.

intro_Scenarios_BusinessCardsRecognition

명함에는 회사 또는 개인에 대한 비즈니스 정보가 포함됩니다. 명함에는 이름, 회사명, 전화번호, 팩스, 이메일, 웹사이트 주소 및 이와 유사한 정보가 포함될 수 있습니다. 이러한 정보를 종이 명함에서 추출해 전자 형식으로 저장해야 할 수 있습니다. 저장 대상은 휴대전화의 전자 주소록, 이메일 클라이언트 또는 기타 데이터 저장 시스템일 수 있습니다. 예를 들어 명함은 이메일이나 네트워크를 통해 vCard 형식으로 자주 전달됩니다.

자세한 내용은Business Cards Recognition을(를) 참조하세요.

intro_Scenarios_Machine-readable-zone-extraction

많은 국가의 공식 여행 문서나 신분증에는 문서 데이터를 더 정확하게 처리할 수 있도록 하는 기계 판독 영역(MRZ)이 포함되어 있습니다.

이 시나리오는 고객 온보딩 또는 검증 프로세스 중 신분증의 기계 판독 영역에서 데이터를 추출하는 데 사용됩니다. 시스템은 문서 이미지에서 MRZ를 인식하고 여기서 데이터를 추출합니다. 추출된 데이터에는 문서와 소지자에 대한 개인 정보가 포함된 여러 fields(문서 유형 및 만료일, 문서 소지자의 이름과 성 등)가 들어 있습니다. fields를 검색하고 데이터를 검증한 다음, 후속 처리를 위해 외부 파일에 저장할 수 있습니다.

자세한 내용은기계 판독 영역 캡처를 참조하세요.

기타

intro_Scenarios_Scanning

이 시나리오에서는 이미지를 스캔해 파일로 저장하는 “스캐닝 컴퓨터”에서 ABBYY FineReader Engine을 사용합니다.

이 시나리오는 문서 처리의 준비 단계에서 다른 시나리오의 일부로 사용할 수 있습니다. 즉, 이후 처리를 위해 문서의 전자 버전을 얻는 데 사용됩니다. 예를 들어 보관을 위한 문서 스캔, 편집 가능한 문서 버전 확보, 문서에서 의미 있는 데이터 추출 등의 용도로 활용할 수 있습니다.

종이 문서를 스캔해 이미지를 전자 형식으로 저장하면 인쇄 문서의 고품질 전자 버전을 만들 수 있습니다.

자세한 내용은 Scanning을 참조하세요.

intro_Scenarios_DocumentClassification

문서 분류의 목적은 문서를 사용자 정의 범주 중 하나에 할당하는 것입니다. 계약서, 송장, 영수증처럼 여러 유형의 문서로 이루어진 문서 흐름을 처리해야 할 수 있습니다. 이 경우 각 문서의 유형을 식별해야 합니다. 예를 들어 문서 유형에 따라 서로 다른 폴더로 분류하거나 유형에 맞게 파일 이름을 바꾸고자 할 수 있습니다. 이는 사전 학습된 시스템을 사용해 자동으로 수행할 수 있습니다.

이 시나리오의 핵심은 처리할 문서 유형을 미리 알고 있다는 점입니다. ABBYY FineReader Engine은 문서의 외형이나 내용을 기준으로 문서를 분류할 수 있습니다.

자세한 내용은Document Classification을 참조하세요.

intro_Scenarios_DocumentComparison

종이 문서를 다룰 때는 실수나 의도적으로 이루어진 변경 사항을 찾아 수정해야 할 수 있습니다.

이 시나리오는 계약서나 은행 문서처럼 특히 중요한 문서를 해당 사본과 비교하는 데 사용됩니다. 비교 결과에는 콘텐츠 유형(텍스트만 해당), 수정 유형(삭제, 삽입 또는 수정), 그리고 원본과 사본에서의 위치 정보가 포함됩니다. 감지된 차이점 목록이나 변경 영역을 가져올 수 있으며, 이후 처리나 장기 보관을 위해 비교 결과를 외부 파일로 저장할 수도 있습니다.

자세한 내용은문서 비교을 참조하세요.

참고 항목

기본 사용 시나리오 구현