主要な認識パラメーターの 1 つは、認識時に使用する言語です。解析と認識を実行する前に、適切な言語を設定しておくことが重要です。認識言語は、IRecognizerParams::SetPredefinedTextLanguage メソッドを使って簡単に指定できます。このメソッドは、IRecognizerParams::TextLanguage プロパティに反映されます。既定では、このパラメーターは英語の認識言語で初期化されています。言語の自動検出を使用することもできます (詳細は IRecognizerParams::LanguageDetectionMode プロパティを参照してください) 。 以下では、ABBYY FineReader Engine が既定でサポートしている言語と、認識言語を扱うための高度な機能を提供するオブジェクトについて、役立つ情報を紹介します。Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
事前定義言語
テキストの認識言語
- 内部名。内部言語には一意の名前を付けることをお勧めします。ABBYY FineReader Engine の配布パッケージに含まれる言語には、すでに一意の名前が設定されています。新しい言語の名前も、必ず一意にしてください。
- 文字セット。TextLanguage オブジェクトには、次の文字セットが含まれます。単語間に現れる可能性のある句読点、使用禁止文字、および単語の直前または直後にのみ付く追加の句読点です。
- 禁止辞書。TextLanguage オブジェクトの ProhibitingDictionaries プロパティを使用すると、禁止辞書のコレクションを作成できます。これらの辞書に含まれる単語は、認識された単語の候補として使用できません。ただし、ほかに候補がなく、禁止語を使用する以外に選択肢がない場合は、これらの辞書の単語が認識テキストに現れることがあります。辞書の使用方法 を参照してください。
文字の認識言語
- 内部名。内部言語には一意の名前を付けることをお勧めします。ABBYY FineReader Engine 配布パックに含まれる言語には、すでに一意の名前が設定されています。新しい言語の名前も必ず一意にしてください。
- 文字セット。文字セットには、その言語のアルファベットを構成する文字、拡張アルファベットを構成する文字 (外来語で使用) 、単語の直前および直後に置く句読点、単語内での使用は許可されているものの内部スペルチェックシステムでは無視される文字、ならびに下付き文字および上付き文字で使用できる記号が含まれます。
- 辞書。単語の認識言語には辞書を関連付けることができます。辞書の使用方法 を参照してください。
複合認識言語の作成
- IEngine::CreateLanguageDatabase メソッドを呼び出して、LanguageDatabase オブジェクトを作成します。
- パラメーター “English,German” を指定して ILanguageDatabase::CreateCompoundTextLanguage メソッドを呼び出します。
- 取得した TextLanguage オブジェクトをテキスト認識に使用します。
- IEngine::CreateLanguageDatabase メソッドを呼び出して、LanguageDatabase オブジェクトを作成します。
- ILanguageDatabase::LoadFrom メソッドを使用して、言語を LanguageDatabase オブジェクトに読み込みます。
- LanguageDatabase オブジェクトから、必要な言語を名前で TextLanguage オブジェクトとして取得します。
- 取得した TextLanguage オブジェクトをテキスト認識に使用します。
