Saltar al contenido principal
Las propiedades básicas de la Definición de Document, como su nombre, idioma y estilo de escritura, se configuran con la ayuda del Asistente de Definición de Document. Otras propiedades se configuran de forma predeterminada. Puede ver y cambiar las propiedades de una Definición de Document en el cuadro de diálogo de propiedades que se abre cuando selecciona el elemento de menú Document Definition → Propiedades de Definición de Document… en la ventana del editor de Definición de Document. El cuadro de diálogo tiene las siguientes pestañas:
  • La pestaña General
En esta pestaña puede cambiar el nombre de la Definición de Document e introducir o editar su descripción. La opción Habilitado incluye o excluye la Definición de Document del procesamiento de documentos.
  • La pestaña Recognition
El programa utiliza un reconocimiento rápido, denominado reconocimiento de texto completo, para la clasificación, el emparejamiento de un FlexiLayout y el resaltado de texto en imágenes. Esta pestaña se utiliza para especificar la configuración del reconocimiento de texto completo. Tenga en cuenta que la configuración de reconocimiento de campos se especifica en las propiedades del campo.
  • Preferir configuración del batch type**.** Seleccione esta opción si desea sincronizar la configuración del reconocimiento de texto completo. Nota: Deshabilitar la sincronización puede hacer más lento el emparejamiento de la Definición de Document.
  • Idiomas**.** Es necesario establecer el idioma correcto para que el reconocimiento se realice sin errores. Esta propiedad define tanto el idioma como otros ajustes, como el formato de fecha, la divisa, etc.
  • Seleccione un modo de Recognition de la lista:
    • Modo rápido. Las imágenes en color y en semitono se binarizan antes del reconocimiento (es decir, se convierten a blanco y negro). El reconocimiento rápido requiere menos tiempo y, en la mayoría de los casos, proporciona resultados satisfactorios.
    • Modo equilibrado. El programa también tiene en cuenta los colores de la imagen. El reconocimiento en este modo es más lento, pero ofrece mejor calidad. Nota: No se prevén más modificaciones en los algoritmos del modo de reconocimiento Balanced, ya que ya se han alcanzado los mejores niveles posibles de velocidad y calidad.
    • El modo normal es el predeterminado. También se recomienda cuando el prerreconocimiento en modo Fast / Balanced produce varios errores.
    • El modo Accurate está pensado para extraer datos de imágenes digitales apenas legibles o de documentos de baja calidad. Nota: El modo Accurate requiere más tiempo y, por lo tanto, se recomienda usarlo solo con imágenes o documentos problemáticos.
  • Configuración avanzada de reconocimiento…
    • Puede seleccionar una o varias opciones en Corregir orientación de página si desea que un grupo de páginas se gire 180°, 90° en el sentido de las agujas del reloj o 90° en sentido contrario, cuando su orientación se selecciona automáticamente.
    • Si es necesario, especifique cómo se imprimirá un formulario en blanco (Tipográfico, Impresora matricial, Máquina de escribir) en la sección Tipo de texto y seleccione la opción Usar pattern para agregar un pattern de ejemplo.
    • Códigos de barras**.** Parámetros del procesamiento de códigos de barras:
      • Deshabilitar la extracción de códigos de barras. Seleccione esta opción si no deben encontrarse códigos de barras en las imágenes. Esto acelerará considerablemente el reconocimiento de documentos.
      • Extraer códigos de barras 2D: Data Matrix, Aztec, QR Code**.** Seleccione esta opción si sus imágenes contienen códigos de barras de los tipos especificados. Si la opción no está seleccionada, no se encontrarán en las imágenes los códigos de barras Data Matrix, Aztec ni QR Code.
  • Extraer códigos de barras postales. Seleccione esta opción si sus imágenes contienen códigos de barras postales. Si esta opción no está seleccionada, no se encontrarán códigos de barras postales en las imágenes. ¡Importante! La extracción de códigos de barras ralentiza el reconocimiento.
  • Prerreconocimiento CJK
    • Modo furigana separado**.** Seleccione esta opción para mejorar el reconocimiento de ayudas fonéticas (furigana) en japonés.
  • Reconocimiento de entidades con nombre: Extraer entidades con nombre; extracción de información mediante métodos de NLP. Nota: Requiere un módulo de NLP y un tipo de licencia específico.
  • Extracción de texto vertical – Parámetros de extracción de texto vertical:
    • Extraer para todos los idiomas – Detecta texto con orientación vertical escrito en cualquiera de los idiomas compatibles.
    • No extraer – Impide la detección de texto con orientación vertical.
    • Extraer para idiomas CJK – Detecta texto vertical escrito en chino, japonés o coreano.
  • Haga clic en el botón Advanced… para configurar la corrección de distorsiones lineales y no lineales de las imágenes, especificar la dirección del alimentador automático del escáner, etc. Nota: Seleccione la opción Corregir distorsión lineal para especificar parámetros de expansión o compresión de la imagen por altura y anchura. Las imágenes se escalan mediante anclas existentes (cuadrado negro, cruz o esquina), así como separadores horizontales y verticales.
  • Monto de dinero – Una combinación de un monto numérico y un código o símbolo de divisa. Para evitar errores de reconocimiento con caracteres visualmente similares, como 1, I e i, o s y $, se utiliza una expresión regular que permite letras solo en determinadas combinaciones que representan códigos de divisa, ya sea antes o inmediatamente después del monto numérico. Los principales códigos de divisa se enumeran en Divisas.
Puede modificar la lista de posibles códigos y símbolos de divisa si es necesario. Por ejemplo, si sabe qué códigos y símbolos de divisa pueden aparecer en sus documentos, eliminar de la lista las divisas redundantes mejorará la calidad del reconocimiento. También puede agregar a la lista códigos y símbolos de divisa personalizados. Para modificar la lista, haga clic en el botón […] de la derecha. En el cuadro de diálogo Símbolos de divisa, puede agregar o quitar códigos o símbolos de divisa. Como alternativa, abra el cuadro de diálogo de propiedades del campo, haga clic en la pestaña Data y realice los cambios necesarios. Para obtener más información, consulte Tipos de datos del campo de entrada de texto. Nota: Una Definición de Document solo puede tener una lista de posibles códigos y símbolos de divisa. Esta lista se aplica a todos los campos Monto de dinero.
  • La pestaña Assembly
Esta pestaña está pensada para configurar reglas de ensamblado para documentos de varias páginas. En el caso más sencillo, la Definición de Document comprende una sola sección que aparece una vez. Si una Definición de Document consta de varias secciones, esta pestaña mostrará la lista de sus nombres. Puede especificar el número de apariciones de cada sección modificando los números en las columnas Min number y Max number.
  • Utilizar la regla de ensamblado por igualdad de campos clave: habilite esta opción si desea comprobar el ensamblado de documentos en función de los campos clave. A continuación, seleccione un campo clave para cada sección en la columna Key Field. Al introducir documentos, solo se considerarán correctamente ensamblados aquellos cuyos valores de los campos clave coincidan en cada sección. Si los valores no coinciden, se mostrará un mensaje de error de ensamblado.
  • Utilizar reglas de ensamblaje estándar - habilite esta opción si desea comprobar el ensamblado de documentos mediante las siguientes reglas estándar:
    • Deshabilitar la comprobación del orden de las secciones - habilite esta opción si desea desactivar las comprobaciones del orden de las secciones en el documento (por ejemplo, si el orden de las secciones no afecta al ensamblado del documento). El programa seguirá comprobando que todas las secciones estén presentes en el documento, pero ignorará el orden.
    • Habilitar páginas anexas - habilite esta opción si desea procesar documentos con anexos. Si el procesamiento de documentos con anexos está habilitado, también puede seleccionar la opción Detectar anexos usando la estructura preestablecida del documento, sin analizar (rápido) para detectar anexos más rápidamente en función de la estructura actual del documento.
Nota: La opción Detectar anexos usando la estructura preestablecida del documento, sin analizar (rápido) solo es efectiva para documentos creados mediante separación durante la fase de importación o mediante la aplicación de una marca especial en la API. Dichos documentos se excluyen del ensamblado.
  • Utilizar reglas de ensamblaje personalizadas - habilite esta opción si desea comprobar el ensamblado de documentos mediante un script de ensamblado de documentos. Un script de ensamblado personalizado puede ejecutarse tanto por separado como junto con las reglas de ensamblaje estándar. Para empezar a editar el script, haga clic en el botón Edit Assembly Script… Se abrirá la ventana Script Editor.
Para obtener más información, consulte Creación de definiciones de Document para documentos de varias páginas, Ensamblado de páginas en documentos y Creación de definiciones de Document para documentos con anexos.
  • Las reglas
Esta pestaña está pensada para realizar acciones con las reglas de la Definición de Document. Puede eliminar, editar o crear reglas nuevas. Para obtener más información, consulte Validación de reglas.
  • Los destinos de exportación
Esta pestaña muestra la configuración de exportación actual de la Definición de Document especificada. Para cambiar la configuración de exportación, haga clic en el botón Edit…
  • El formulario de datos
En esta pestaña puede modificar el estilo y el tamaño de la fuente para mostrar los datos reconocidos.
  • El grupo Configuración del texto de los datos contiene la configuración de fuente para mostrar los valores reconocidos.
  • El grupo Configuración del texto de las etiquetas contiene la configuración para mostrar el texto explicativo (nombres de los campos).
Para obtener más información, consulte Configuración de la presentación de datos en la ventana Document.
  • Los conjuntos de datos
En esta pestaña puede crear y editar conjuntos de datos personalizados. Para obtener más información, consulte Uso de bases de datos de proveedores y business unit.
  • Los controladores de eventos
En esta pestaña puede especificar controladores de eventos para documentos del tipo actual. Para obtener más información, consulte Controladores de eventos.
  • Las .NET References
En esta pestaña puede agregar ensamblados externos para utilizarlos en scripts y módulos globales. Se pueden usar tanto ensamblados estándar como ensamblados compilados por el usuario. Para agregar un ensamblado, haga clic en Add… En el cuadro de diálogo que se abre, seleccione el tipo: Standard assembly name o Attached file. Según el tipo seleccionado, introduzca el nombre del ensamblado estándar o busque un archivo de ensamblado. Para obtener más información, consulte ensamblado externo.