메인 콘텐츠로 건너뛰기

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

이 항목은 Windows용 FRE에 적용되지만 Visual Components는 필요하지 않습니다.
IRecognizerParams::TrainUserPatterns 속성이 TRUE로 설정되어 있으면 인식 과정에서 Train User Pattern 모드가 사용됩니다. 알 수 없는 문자가 나오면 패턴 학습 대화 상자가 열리고, 그 안에 해당 문자 이미지가 표시됩니다. PatternTrainingDialog
대화 상자를 표시하지 않고 패턴 학습을 수행하려면 IEngine::TrainUserPattern 메서드를 사용할 수도 있습니다. 이 메서드는 문자 이미지의 컬렉션을 저장하는 TrainingImagesCollection 객체와 문자 자체를 입력 매개변수로 받습니다.

문자 인식을 위한 학습

위쪽 대화 상자의 프레임은 문자 하나만 감싸야 하며, 해당 문자가 프레임 안에 완전히 들어가야 합니다. 프레임이 문자의 일부만 감싸거나 두 개 이상의 문자를 감싸는 경우에는 프레임 테두리를 클릭한 다음, 위 조건을 충족하도록 위치를 조정하십시오. MoveBodyLeftMoveBodyRight 버튼으로도 프레임 테두리를 이동할 수 있으며(기울임꼴 문자 학습 시 유용함), 프레임을 올바른 위치에 맞춘 후 문자를 입력하고 Train 버튼을 클릭하십시오.
  • 시스템은 alphabet에 포함된 문자만 읽도록 학습시킬 수 있습니다. 키보드로 입력할 수 없는 문자를 ABBYY FineReader Engine이 읽도록 학습시키려면, 해당 문자를 나타내기 위해 두 문자의 조합을 사용하거나 Character Table에서 필요한 문자를 복사하십시오(Character Table을 열려면 패턴 학습 대화 상자에서 DotButton 버튼을 클릭).
  • 시스템이 문자 서식을 유지하도록 학습시키려면, Train 버튼을 클릭하기 전에 패턴 학습 대화 상자에서 해당 Italic 또는 Bold 항목을 선택하십시오.
  • 대문자/소문자 문자 이미지를 각각 학습할 때는 반드시 해당 대문자/소문자만 입력해야 합니다.
학습 중 실수한 경우 Back 버튼을 클릭하여 프레임을 이전 위치로 되돌리십시오. 마지막에 입력한 “이미지 — 문자” 쌍은 패턴에서 자동으로 제거됩니다. 이 “실행 취소” 기능은 마지막으로 학습한 단어에만 적용됩니다.

합자 인식을 위한 학습

합자는 두 개 또는 세 개의 문자가 서로 “붙어” 있는 형태로, 예를 들어 fi, fl, ffi 등이 있습니다. 이러한 문자는 인쇄 과정에서 서로 붙어 있기 때문에 분리하기가 어렵습니다. 실제로는 이를 하나의 복합 문자로 취급하는 것이 더 좋은 결과를 얻는 데 도움이 됩니다. 합자를 학습시키는 방법은 개별 문자를 학습시키는 방법과 다르지 않습니다.
  1. 필요한 문자 조합을 입력하고 Train 버튼을 클릭합니다.
  2. 위쪽 대화 상자의 프레임이 합자 전체를 둘러싸야 합니다. 마우스를 사용하거나 MoveBodyLeftMoveBodyRight 버튼을 클릭하여 프레임 경계를 이동할 수 있습니다.
각 패턴에는 최대 1000개의 새 문자를 포함할 수 있습니다. 그러나 합자를 너무 많이 만들면 인식 품질에 악영향을 줄 수 있으므로 너무 많이 만들지 않는 것이 좋습니다.

학습 제한 사항

ABBYY FineReader Engine을 학습시킬 때는 다음 제한 사항도 고려해야 합니다:
  • ABBYY FineReader Engine은 일반적으로 서로 다른 문자로 여겨지는 일부 문자를 구분하지 않습니다. 이러한 이미지는 모두 동일한 문자로 인식됩니다. 예를 들어, 직선(’), 오른쪽(’), 왼쪽(‘) 아포스트로피는 패턴에 하나의 문자, 즉 직선 아포스트로피로 저장됩니다. 따라서 이를 학습시키려고 해도 인식된 텍스트에는 오른쪽 및 왼쪽 아포스트로피가 나타나지 않습니다.
  • 경우에 따라 특정 이미지는 주변 문맥에 따라 특정 문자로 인식됩니다.
  • CJK 언어에서는 패턴 학습이 지원되지 않습니다.

참고 항목

학습을 사용한 인식 RecognizerParams