L’un des principaux paramètres de reconnaissance est la langue utilisée lors de la reconnaissance. Il est important de définir la langue appropriée avant l’analyse et la reconnaissance. Vous pouvez spécifier facilement la langue de reconnaissance à l’aide de la méthode IRecognizerParams::SetPredefinedTextLanguage. Cette méthode agit sur la propriété IRecognizerParams::TextLanguage. Par défaut, ce paramètre est initialisé avec l’anglais comme langue de reconnaissance. Vous pouvez également utiliser la détection automatique de la langue (voir la propriété IRecognizerParams::LanguageDetectionMode pour plus d’informations). Vous trouverez ci-dessous des informations utiles sur les langues prises en charge par défaut dans ABBYY FineReader Engine, ainsi que sur les objets offrant des fonctionnalités avancées pour gérer les langues de reconnaissance.Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
Langues prédéfinies
Langue de reconnaissance d’un texte
- Nom interne. Nous recommandons de choisir un nom unique pour la langue interne ; c’est déjà le cas pour les langues fournies dans le pack de distribution d’ABBYY FineReader Engine. Veillez à ce que les noms des nouvelles langues soient également uniques.
- Jeux de lettres. L’objet TextLanguage contient les jeux de lettres suivants : les signes de ponctuation pouvant apparaître entre les mots, les caractères interdits et les signes de ponctuation supplémentaires placés immédiatement avant et après les mots.
- Dictionnaires d’interdiction. Vous pouvez créer une collection de dictionnaires d’interdiction à l’aide de la propriété ProhibitingDictionaries de l’objet TextLanguage. Les mots de ces dictionnaires ne peuvent pas être utilisés comme variantes d’un mot reconnu. Toutefois, s’il ne reste plus aucune variante et que l’utilisation d’un mot interdit est la seule possibilité, des mots issus de ces dictionnaires peuvent tout de même apparaître dans le texte reconnu. Voir Travailler avec les dictionnaires.
Langue de reconnaissance des caractères
- Nom interne. Nous recommandons de choisir un nom unique pour la langue interne ; c’est déjà le cas pour les langues fournies avec le pack de distribution d’ABBYY FineReader Engine. Veillez à ce que les noms des nouvelles langues soient également uniques.
- Jeux de lettres. Un jeu de lettres comprend les lettres qui forment l’alphabet de la langue, les lettres qui forment son alphabet étendu (utilisé dans les mots d’emprunt), les signes de ponctuation placés immédiatement avant et après les mots, les caractères autorisés à l’intérieur des mots mais ignorés par le système interne de vérification orthographique, ainsi que les symboles autorisés en indice et en exposant.
- Dictionnaire. Une langue de reconnaissance associée à un mot peut avoir un dictionnaire qui lui est attaché. Voir Travailler avec les dictionnaires.
Création d’une langue de reconnaissance composite
- Créez un objet LanguageDatabase en appelant la méthode IEngine::CreateLanguageDatabase.
- Appelez la méthode ILanguageDatabase::CreateCompoundTextLanguage avec le paramètre “English,German”.
- Utilisez l’objet TextLanguage obtenu pour la reconnaissance de texte.
- Créez un objet LanguageDatabase en appelant la méthode IEngine::CreateLanguageDatabase.
- Chargez les langues dans l’objet LanguageDatabase à l’aide de la méthode ILanguageDatabase::LoadFrom.
- Récupérez la langue requise par son nom sous la forme d’un objet TextLanguage à partir de l’objet LanguageDatabase.
- Utilisez l’objet TextLanguage obtenu pour la reconnaissance de texte.
