Saltar al contenido principal

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

Este objeto permite acceder a distintos parámetros de un carácter individual del texto reconocido: su formato, su rectángulo en la imagen, el idioma de reconocimiento y las hipótesis de reconocimiento. Todas las propiedades booleanas de un objeto de este tipo recién creado se establecen en FALSE.
Si desea trabajar con los parámetros de un determinado carácter del texto reconocido, primero debe llamar a cualquiera de las funciones que realizan la síntesis (por ejemplo, el método Process o Synthesize del objeto FRDocument), ya que estos parámetros solo adquieren significado después de la síntesis.
Si el carácter se obtiene del texto de una tarjeta de visita, solo se establecen las siguientes propiedades del objeto:
  • BaseLine
  • Bottom
  • Left
  • Right
  • Top
  • IsSuspicious
  • ErrorProbability
  • CharacterRegion
  • CharacterRecognitionVariantIndex
  • CharacterRecognitionVariants
  • SelectedCharacterRecognitionVariant
  • WordRecognitionVariants
  • IsFromSourceContent
  • IsWordFirst
  • IsWordLeftmost

Propiedades

, de solo lectura

Devuelve el objeto Engine.

Especifica el ID del idioma del carácter. Para convertirlo a Win32 LCID, use el método.

De forma predeterminada, esta propiedad se inicializa con el ID del idioma predeterminado del sistema.

Almacena y permite establecer el nombre interno del idioma de un carácter.

Si un idioma de reconocimiento base corresponde a una palabra reconocida, la propiedad LanguageName de cada carácter de esa palabra se establece con el nombre interno del idioma base después del reconocimiento. Si varios idiomas de reconocimiento base corresponden a una palabra (por ejemplo, en el caso de palabras compuestas bilingües), la propiedad LanguageName de los caracteres de esa palabra queda vacía. En cambio, la propiedad LanguageId contiene el identificador del idioma base independientemente de cuál sea la palabra reconocida.

De forma predeterminada, el valor de esta propiedad es una cadena vacía.

Especifica la región exacta del carácter. La región puede no ser rectangular e inicialmente está contenida en el rectángulo definido por las propiedades Left, Top, Right y Bottom. Si cambia la región exacta del carácter, las propiedades Left, Top, Right y Bottom no se modifican.

La propiedad solo está disponible después del reconocimiento con lapropiedad establecida en TRUE.

La propiedad devuelve un objeto constante. Para cambiar la región exacta del carácter, primero debe obtener un objeto Region intermedio mediante el método IEngine::CreateRegion, cambiar los parámetros necesarios y, a continuación, asignar a la propiedad el objeto obtenido.

, de solo lectura

Almacena la coordenada del borde inferior del rectángulo del carácter. Este rectángulo se define en la imagen, sin tener en cuenta la orientación del texto. Puede no estar definido; en ese caso, las cuatro coordenadas son cero. Esta propiedad no puede modificarse directamente, sino mediante el método SetRect.

El valor predeterminado de esta propiedad es 0.

, de solo lectura

Almacena la coordenada del borde izquierdo del rectángulo del carácter. Este rectángulo se define en la imagen, sin tener en cuenta la orientación del texto. Puede no estar definido; en ese caso, sus cuatro coordenadas son cero. Esta propiedad no se puede cambiar directamente, sino mediante el método SetRect.

El valor predeterminado de esta propiedad es 0.

, de solo lectura

Almacena la coordenada del borde derecho del rectángulo del carácter. Este rectángulo se define en la imagen, sin tener en cuenta la orientación del texto. Puede no estar definido; en ese caso, sus cuatro coordenadas son cero. Esta propiedad no puede modificarse directamente, sino mediante el método SetRect.

El valor predeterminado de esta propiedad es 0.

, de solo lectura

Almacena la coordenada del borde superior del rectángulo del carácter. Este rectángulo se define en la imagen, sin tener en cuenta la orientación del texto. Puede no estar definido; en ese caso, sus cuatro coordenadas son cero. Esta propiedad no puede cambiarse directamente, sino mediante el método SetRect.

El valor predeterminado de esta propiedad es 0.

Especifica si el carácter es el situado más a la izquierda de una palabra.

En situaciones complejas (como dos palabras no separadas por un espacio o una palabra que contiene un signo de puntuación sin espacios), es posible que esta propiedad no funcione correctamente. El motor de reconocimiento puede cambiar la hipótesis sobre la cantidad de palabras después de que se hayan establecido las marcas de los caracteres.

Esta propiedad se establece durante la síntesis. Si se consulta antes de que se complete la síntesis, su valor predeterminado es FALSE.

Para chino, japonés o coreano, esta propiedad no es fiable, ya que no se detectan las palabras.

Especifica si el carácter es el primero de una palabra.

Esta propiedad se establece durante la síntesis. Si se consulta antes de que se complete la síntesis, su valor predeterminado es FALSE.

Notas:

  • En los idiomas con dirección de escritura de derecha a izquierda (por ejemplo, hebreo), esta propiedad indicará el carácter situado más a la derecha de la palabra.
  • En chino, japonés o coreano, esta propiedad no es fiable, ya que no se detectan palabras.

Establece el desplazamiento de un carácter respecto a la línea base de la cadena, en píxeles. La línea base de la cadena se define mediante la propiedad. Esta propiedad se utiliza principalmente para las imágenes incrustadas en el texto.

De forma predeterminada, el valor de esta propiedad es 0.

Especifica un espaciado adicional entre los caracteres en twips. Un twip equivale a 1/20 de punto, y un punto equivale a 1/72”.

El valor predeterminado de esta propiedad es 0.

Almacena el factor de escala horizontal de un carácter en 1/1000.

Si el carácter se obtiene del texto de una tarjeta de visita, esta propiedad toma el valor predeterminado.

El valor predeterminado de esta propiedad es 1000, lo que equivale a no aplicar ningún escalado.

Establece el valor RGB del color del símbolo. El color de fondo se define para todo el párrafo mediante la propiedad.

El valor de esta propiedad puede ser -1, lo que significa que el color es transparente.

El valor int se calcula a partir de la tripleta RGB mediante la fórmula: ( valor de rojo ) + (256 x valor de verde ) + (65536 x valor de azul ), donde valor de rojo es el primer componente de la tripleta, valor de verde es el segundo componente de la tripleta y valor de azul es el tercer componente de la tripleta. Por ejemplo, el valor int del color blanco es 16777215.

De forma predeterminada, el color del texto es negro, o RGB(0,0,0).

Especifica si el carácter está en negrita.

Si el carácter se obtiene del texto de una tarjeta de visita, esta propiedad tiene un valor predeterminado.

Esta propiedad es FALSE de forma predeterminada.

Especifica si el carácter está en cursiva.

Si el carácter se obtiene del texto de una tarjeta de visita, esta propiedad tiene un valor predeterminado.

El valor predeterminado de esta propiedad es FALSE.

Especifica si el carácter está subrayado.

De forma predeterminada, esta propiedad es FALSE.

Especifica si el carácter está tachado.

Si el carácter se obtiene del texto de una tarjeta de visita, esta propiedad tiene su valor predeterminado.

El valor predeterminado de esta propiedad es FALSE.

Especifica si el carácter es un subíndice. No se puede establecer en TRUE simultáneamente con la propiedad IsSuperscript, ya que esto provocará errores durante la exportación del texto reconocido.

Si el carácter se obtiene del texto de una tarjeta de visita, esta propiedad tiene su valor predeterminado.

Esta propiedad es FALSE de forma predeterminada.

Especifica si el carácter está en superíndice. No se puede establecer en TRUE al mismo tiempo que la propiedad IsSubscript, ya que esto provocará errores durante la exportación del texto reconocido.

Si el carácter se obtiene del texto de una tarjeta de visita, esta propiedad toma el valor predeterminado.

De forma predeterminada, esta propiedad es FALSE.

Especifica si el carácter tiene estilo de “versalitas”. Esto significa que los caracteres en minúscula se muestran como mayúsculas de menor tamaño.

Esta propiedad es FALSE de forma predeterminada.

, de solo lectura

Almacena el nombre de la fuente de un carácter. Esta propiedad no puede modificarse directamente, sino a través del método SetFont.

De forma predeterminada, este valor es “Times New Roman”.

Especifica el tamaño de la fuente del carácter en twips. Un twip es 1/20 de punto y un punto es 1/72”.

El valor predeterminado de esta propiedad corresponde a 10 puntos o 200 twips.

Permite acceder al estilo de fuente del carácter.

, de solo lectura

Indica el tipo de fuente de un carácter. Esta propiedad no se puede cambiar directamente, sino mediante el método SetFont.

De forma predeterminada, este valor es FT_Unknown.

Devuelve TRUE si el carácter se reconoció de manera poco fiable. Use esta propiedad para determinar si es necesaria la verificación.

Esta propiedad se calcula en función del valor ErrorProbability y de la configuración de reconocimiento. Si necesita implementar distinciones más precisas para la verificación, use ErrorProbability en su lugar.

Esta propiedad es FALSE de forma predeterminada.

, de solo lectura

Devuelve la probabilidad estimada (en un rango de 0 a 100) de que el carácter se haya reconocido incorrectamente.

La probabilidad de error tiene en cuenta todo el contexto, por lo que solo está disponible para el resultado del reconocimiento, no para cada variante de reconocimiento de caracteres. Para comparar las variantes de reconocimiento entre sí, utilice.

La probabilidad de error no se calcula para los símbolos obtenidos sin reconocimiento, por ejemplo, los tomados directamente del archivo PDF de origen.

, de solo lectura

Devuelve una colección de variantes de reconocimiento de caracteres.

El valor de la propiedad es cero para los caracteres no imprimibles (espacios, retornos de carro, etc.) y para los caracteres que no se reconocieron, pero se agregaron al texto durante una edición explícita. También se devuelve cero si el texto fue reconocido por una de las versiones anteriores de ABBYY FineReader Engine.

Si la propiedadestá establecida en FALSE, la colección devuelta contiene un elemento; de lo contrario, la colección contiene al menos un elemento y las variantes se ordenan de la mejor a la peor.

, de solo lectura

Almacena el índice de la variante de reconocimiento de caracteres seleccionada en la colección CharacterRecognitionVariants.

, de solo lectura

Contiene la variante de reconocimiento de caracteres seleccionada. Es el elemento con el índice CharacterRecognitionVariantIndex de la colección de variantes de reconocimiento de caracteres (la propiedad CharacterRecognitionVariants).

, de solo lectura

Devuelve una colección de variantes de reconocimiento de la palabra a la que pertenece el carácter.

La propiedad contiene cero para los caracteres no imprimibles (espacios, retornos de carro, etc.) y para los caracteres que no se reconocieron, pero se agregaron al texto durante una edición manual. También devuelve cero si el texto fue reconocido por una versión anterior de ABBYY FineReader Engine.

Si lapropiedad se establece en FALSE, la colección devuelta contiene un elemento; de lo contrario, la colección contiene al menos un elemento y las variantes se ordenan de la mejor a la peor, según el mecanismo interno de estimación.

, de solo lectura

Especifica si el carácter se ha extraído del contenido textual del archivo de entrada sin necesidad de reconocimiento. Por ejemplo, puede extraerse de un archivo PDF con una capa de texto.

Especifica si se realizó una corrección ortográfica en este carácter. ABBYY FineReader Engine no lo usa ni lo establece internamente; solo le proporciona una base para la corrección ortográfica.

Métodos

NombreDescripción
CopyFromInicializa las propiedades del objeto actual con los valores de propiedades similares de otro objeto.
SetFontEstablece la nueva fuente para el símbolo.
SetRectEstablece el nuevo Rectangle para el símbolo.
CharParams Diagrama de objetos

Parámetro de salida

Este objeto es el parámetro de salida de los siguientes métodos:

Parámetro de entrada

Este objeto se pasa como parámetro de entrada a los siguientes métodos:

Ejemplos

int suspiciousCharsCount = 0;
// Calcula el número de caracteres sospechosos en un bloque de texto
void computeStatisticsForBlock(FREngine.IBlock block)
{
 if (block.Type == FREngine.BlockTypeEnum.BT_Text)
 {
  FREngine.ITextBlock textBlock = block.GetAsTextBlock();
  int paragraphsCount = textBlock.Text.Paragraphs.Count;
  for (int iPar = 0; iPar < paragraphsCount; iPar++)
  {
   FREngine.IParagraph par = textBlock.Text.Paragraphs[iPar];
   string text = par.Text;
   FREngine.ICharParams charParams = engine.CreateCharParams();
   for (int iChar = 0; iChar < text.Length; iChar++)
   {
    par.GetCharParams(iChar, charParams);
    if (charParams.IsSuspicious)
    {
     suspiciousCharsCount++;
    }
   }
  }
 }
}
El objeto se usa en los siguientes ejemplos de código: RecognizedTextProcessing (Win) y en las herramientas de demostración de Windows: Engine Predefined Processing Profiles.

Consulte también

Párrafo ¿Cuál es la diferencia entre CharConfidence, ErrorProbability e IsSuspicious? Trabajar con texto Trabajar con propiedades