Uno de los principales parámetros de reconocimiento es el idioma que se utiliza durante este proceso. Es importante establecer el idioma correcto antes del análisis y el reconocimiento. El idioma de reconocimiento puede especificarse fácilmente mediante el método IRecognizerParams::SetPredefinedTextLanguage. Este método afecta a la propiedad IRecognizerParams::TextLanguage. De forma predeterminada, este parámetro se inicializa con el idioma de reconocimiento inglés. También puede usar la detección automática de idioma (consulte la propiedad IRecognizerParams::LanguageDetectionMode para obtener más información). A continuación encontrará información útil sobre los idiomas compatibles de forma predeterminada en ABBYY FineReader Engine y los objetos que ofrecen funciones avanzadas para trabajar con los idiomas de reconocimiento.Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
Idiomas predefinidos
Idioma de reconocimiento de un texto
- Nombre interno. Recomendamos seleccionar un nombre único para el idioma interno; ya lo es en el caso de los idiomas incluidos en el paquete de distribución de ABBYY FineReader Engine. Asegúrese de que los nombres de los nuevos idiomas sean únicos.
- Conjuntos de letras. El objeto TextLanguage contiene los siguientes conjuntos de letras: signos de puntuación que pueden aparecer entre palabras, caracteres prohibidos y signos de puntuación adicionales que van inmediatamente antes y después de las palabras.
- Diccionarios de exclusión. Puede crear una colección de diccionarios de exclusión mediante la propiedad ProhibitingDictionaries del objeto TextLanguage. Las palabras de estos diccionarios no pueden usarse como variantes de una palabra reconocida. Sin embargo, si no queda ninguna variante y usar una palabra prohibida es la única opción, las palabras de estos diccionarios pueden seguir apareciendo en el texto reconocido. Consulte Trabajar con diccionarios.
Idioma de reconocimiento para caracteres
- Nombre interno. Recomendamos seleccionar un nombre único para el idioma interno; ya es único en el caso de los idiomas incluidos en el paquete de distribución de ABBYY FineReader Engine. Asegúrese de que los nombres de los idiomas nuevos sean únicos.
- Conjuntos de letras. Un conjunto de letras incluye las letras que forman el alfabeto del idioma, las letras que forman su alfabeto ampliado (utilizado en palabras tomadas de otros idiomas), los signos de puntuación que aparecen inmediatamente antes y después de las palabras, los caracteres permitidos dentro de las palabras pero ignorados por el sistema interno de revisión ortográfica, y los símbolos permitidos en subíndices y superíndices.
- Dictionary. Un idioma de reconocimiento de una palabra puede tener un diccionario asociado. Consulte Trabajar con diccionarios.
Creación de un idioma de reconocimiento compuesto
- Cree un objeto LanguageDatabase llamando al método IEngine::CreateLanguageDatabase.
- Llame al método ILanguageDatabase::CreateCompoundTextLanguage con el parámetro “English,German”.
- Utilice el objeto TextLanguage obtenido para el reconocimiento de texto.
- Cree un objeto LanguageDatabase llamando al método IEngine::CreateLanguageDatabase.
- Cargue los idiomas en el objeto LanguageDatabase mediante el método ILanguageDatabase::LoadFrom.
- Obtenga el idioma necesario por su nombre como un objeto TextLanguage del objeto LanguageDatabase.
- Utilice el objeto TextLanguage obtenido para el reconocimiento de texto.
