Saltar al contenido principal

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

Comparación de documentos

FunciónDescripción
Nuevo módulo “Comparar documentos”Para verificar rápidamente la integridad del documento, el nuevo módulo “Comparar documentos” de ABBYY FineReader Engine permite detectar diferencias de contenido entre dos versiones del mismo documento.
Comparación de documentos bilingüesLa nueva opción del módulo “Comparar documentos” permite detectar automáticamente el carácter bilingüe de este tipo de documento y su estructura compleja, y comparar cada columna (y, por tanto, cada versión en un idioma) por separado.

Formatos ofimáticos de entrada en Linux y Windows

CaracterísticaDescripción
Procesamiento de documentos ofimáticosAdemás de una amplia variedad de formatos de imagen, FineReader Engine ahora puede procesar documentos de entrada creados en alguno de los siguientes formatos de documentos ofimáticos:
  • Documentos de texto: .doc, .docx, .rtf, .htm / .html, .txt, .odt
  • Hojas de cálculo: .xls, .xlsx, .ods
  • Presentaciones: .ppt, .pptx, .odp

Microsoft Office o LibreOffice deben estar instalados en el sistema.

Captura de MRZ

FunciónDescripción
Captura de datos desde una zona de lectura mecánica (MRZ)La nueva función permite extraer automáticamente datos de la zona de lectura mecánica (MRZ) de los documentos de identidad y agiliza la introducción y verificación de datos personales durante los procesos de incorporación o verificación de clientes.

OCR japonés mejorado

CaracterísticaDescripción
Precisión de reconocimiento de primer nivelCon la nueva versión de ABBYY Fine Reader Engine, el OCR japonés ha mejorado considerablemente y ha llevado la precisión de reconocimiento a un nivel antes inalcanzable para la mayoría de las soluciones.

OCR árabe mejorado

FunciónDescripción
Reconocimiento integral de árabe en imágenes de baja calidadOCR árabe en imágenes de baja calidad, en las que la tecnología general ofrece resultados poco fiables y con muchos errores.

OCR coreano mejorado

CaracterísticaDescripción
Modelo lingüístico de aprendizaje profundo para coreanoUn modelo entrenado para el idioma coreano selecciona la mejor variante de reconocimiento de palabras a partir de hipótesis de reconocimiento, o incluso genera una nueva en función del contexto de reconocimiento (palabras anteriores y posteriores).

Nuevas tecnologías de OCR basadas en redes neuronales

CaracterísticaDescripción
Mejoras en las tecnologías de OCRGracias a los enfoques basados en redes neuronales aplicados al OCR, ABBYY FineReader Engine se ha mejorado para procesar símbolos latinos manuscritos y en letra de imprenta:
  • Modelo lingüístico para una selección coherente y precisa de variantes de palabras
  • Reconocimiento de extremo a extremo para escrituras latinas a fin de procesar documentos multilingües
Tecnología de reconocimiento de códigos de barras mediante aprendizaje automáticoLa arquitectura de red neuronal introduce un nuevo modelo de reconocimiento de código de barras que detecta la región aproximada de un código de barras, lo clasifica y genera una salida representada como una región con el tipo de código de barras más probable.
Nuevo modo de reconocimientoEl nuevo modo Accurate le permite obtener la máxima calidad del documento de salida, a costa de una reducción razonable de la velocidad de reconocimiento. Este modo es el más adecuado para facturas, contratos, recibos y documentos de identidad de baja calidad o generados a partir de fotos.

Mejoras en la calidad del OCR para el texto cercano a sellos y firmas

CaracterísticaDescripción
Detección de texto cercano a sellos y firmasCuando un acuerdo contiene sellos o firmas, el texto circundante se reconoce por separado, lo que mejora la calidad de los documentos procesados.

Nuevas opciones de licencia

CaracterísticaDescripción
Uso de la licencia en línea como licencia de red e independienteLa ayuda para desarrolladores de FineReader Engine 12 se ha ampliado con información adicional sobre las distintas formas de licenciar el SDK y describe los diferentes tipos de opciones de licencia en una tabla comparativa fácil de entender.
Uso de períodos de graciaCon la nueva opción, los clientes pueden usar la licencia de ABBYY FineReader Engine durante un tiempo después de la fecha de vencimiento, ampliando así el período de validez de la licencia.

Tecnologías ICR y OMR en la versión para Linux y macOS

FunciónDescripción
Reconocimiento de texto manuscrito y marcas de selecciónCon ABBYY FineReader Engine 12, puede reconocer caracteres manuscritos y en letra de imprenta, así como marcas de selección de varios tipos. Las tecnologías ICR y OMR se implementan para extraer datos de documentos manuscritos y desarrollar nuevas soluciones de extracción de datos.

Capacidad de ejecutar Engine en entornos en la nube

CaracterísticaDescripción
Nuevas opciones de implementaciónEl nuevo tipo de licencia permite la implementación en entornos virtuales y en la nube, lo que le permite ofrecer una gama más amplia de soluciones. El mecanismo de licencia requiere conexión a Internet y admite servidores proxy.

Nota: Aplicable a FineReader Engine para Linux y Windows.

Wrapper de .NET Core en FRE para Windows

FuncionalidadDescripción
Nuevo framework de desarrolloPara aumentar la eficiencia de los equipos de desarrollo que usan contenedores y otros entornos nativos en este popular enfoque de desarrollo e implementación de software, ABBYY FineReader Engine ahora ofrece un wrapper precompilado de .NET Core 6.

Nuevas bibliotecas en ABBYY FineReader Engine

CaracterísticaDescripción
Uso de la biblioteca NeoMLNeoML es un framework integral de aprendizaje automático de código abierto que le permite crear, entrenar e implementar modelos de aprendizaje automático. Este framework es utilizado por ingenieros para tareas de visión artificial y procesamiento del lenguaje natural, incluido el preprocesamiento de imágenes, la clasificación, el análisis de layout de documentos, el Reconocimiento óptico de caracteres (OCR) y la extracción de datos de documentos estructurados y no estructurados.
PDFium integrado para procesar PDFPDFium es una biblioteca nativa multiplataforma conforme con los estándares PDF que controla todas las operaciones relacionadas con PDF, incluido el procesamiento, el análisis, la representación y la obtención de resultados.

Clasificación de documentos mejorada

FunciónDescripción
Clasificación de documentos mediante NLP y aprendizaje automáticoCon ABBYY FineReader Engine 12, los documentos entrantes pueden clasificarse automáticamente en distintas categorías. Se emplean tecnologías de aprendizaje automático, OCR y procesamiento del lenguaje natural para entrenar clasificadores basados en imágenes y en texto con documentos representativos. La información obtenida se utiliza después durante la etapa de clasificación.
Clasificador basado en texto: seguridad avanzada de los datos de entrenamientoPara entrenar y optimizar el clasificador basado en texto, se deben importar documentos que representen cada categoría documental. Para proteger los datos contenidos en estos documentos, los algoritmos hash implementados evitan la posibilidad de recuperar información de los documentos de muestra.
Muestra de demostración de clasificación mejoradaABBYY FineReader Engine puede procesar PDF, imágenes de documentos escaneados o fotografiados, así como documentos en formatos ofimáticos. Para reflejar esta capacidad en el proceso de clasificación, se mejoró la muestra de demostración precompilada proporcionada para clasificación, que ahora también permite importar documentos ofimáticos además de PDF y formatos de imagen.

Ejemplo de código para la interfaz de línea de comandos (CLI)

FunciónDescripción
Ejemplo de código listo para usarCon este ejemplo de código, los desarrolladores pueden aprovechar de forma eficiente las bibliotecas de ABBYY FineReader Engine e integrar capacidades de procesamiento de documentos en aplicaciones de línea de comandos.

Implementación del extractor de metadatos de PDF

CaracterísticaDescripción
Procesamiento de archivos PDF nativos digitalesAuxInfo es un objeto complementario de PDFium que proporciona información de metadatos de un archivo PDF. El equipo de ABBYY R&D PDFTools implementó su propio objeto AuxInfo compatible con PDFium.

Procesamiento mejorado de PDF

FeatureDescription
Mejoras para PDF con contenido “mixto”ABBYY FineReader Engine ofrece nuevas capacidades para procesar documentos PDF que contienen tanto páginas compuestas solo por imágenes como páginas nativas digitales:
  • Reconocimiento adaptativo para mejorar y acelerar el procesamiento de PDF
  • Clasificador de calidad de la capa de texto para conservar en el formato de salida la de mejor calidad
  • Indicación de la presencia de firma digital en PDF
  • Nuevo modo de reutilización de contenido para procesar documentos con contenido mixto
Uso de contenido adicional en PDFPara permitir una composición más flexible del contenido del PDF, ABBYY FineReader Engine ofrece nuevas opciones:
  • Apertura de PDF Portfolio y procesamiento de su contenido
  • Incorporación de imágenes personalizadas al PDF de salida y gestión de sus posiciones
Compatibilidad adicional con idiomas
FeatureDescription
OCR para farsiABBYY FineReader Engine incorpora opciones de reconocimiento de farsi actualizadas y mejoradas, lo que permite trabajar con mayor eficacia con documentos de Irán, Afganistán y muchos otros países de Oriente Medio.
OCR para georgianoSe añadió el georgiano como nuevo idioma de OCR.
OCR para fórmulas matemáticas simplesLa extracción de caracteres de fórmulas matemáticas simples permite mejorar el reconocimiento de documentos científicos que contienen fórmulas matemáticas simples de una sola línea dentro del texto.
Vista previa técnica de OCR para birmanoSe añadió OCR para birmano como vista previa técnica para mostrar capacidades futuras.
Idiomas especiales para el reconocimiento de fechas en árabe y japonésFineReader Engine admite idiomas especiales para el reconocimiento de campos en FineReader Engine for Windows. La nueva versión añade un reconocimiento de fechas mejorado en árabe y japonés.
Vista previa técnica de OCR para banglaSe añadió OCR para bangla como vista previa técnica para mostrar la funcionalidad potencial.

Recreación mejorada de la estructura del documento

CaracterísticaDescripción
Reconstrucción mejorada de tablasCon ABBYY FineReader Engine 12, las tablas extraídas de los documentos conservan su formato mejor que nunca.
Detección y recreación de columnas equilibradasCuando un documento contiene columnas equilibradas de texto (p. ej., contratos, artículos científicos, artículos, etc.), la estructura original se mantiene intacta, lo que simplifica el procesamiento de documentos.
Nuevo modelo de documento de “una sola columna”Las principales mejoras del nuevo algoritmo se centran en la detección y el análisis de tablas y gráficos.
Análisis mejorado de la estructura de las tablasCon el mecanismo mejorado de conversión de documentos, ABBYY FineReader Engine puede detectar tablas con columnas de números en formato “Accounting”.

Optimización del proceso interno para agilizar el procesamiento

FuncionalidadDescripción
Nuevo esquema de iteración del objeto ILayoutUn nuevo esquema que acelera la iteración del objeto ILayout obtenido tras procesar el documento fuera del proceso principal.

Nota: Aplicable a FineReader Engine para Linux y Windows.

Nuevas opciones de escaneo en FRE para Windows

CaracterísticaDescripción
Más funciones de escaneoABBYY FineReader Engine 12 ofrece numerosas funciones de escaneo del dispositivo:
  • eliminación automática de páginas en blanco del documento
  • recorte automático de páginas
  • corrección automática de la inclinación
  • detección automática del color

Documentación en línea

FunciónDescripción
Documentación disponible en líneaAdemás de la documentación integrada, ahora puede usar la versión en línea, que proporciona información oportuna sobre las funciones y capacidades de ABBYY FineReader Engine.

Versiones más recientes de .NET Framework en FRE para Windows

CaracterísticaDescripción
Compatibilidad con wrappers COM Interop de .NETEl paquete de distribución ahora incluye wrappers COM Interop de .NET para las siguientes versiones de .NET Framework:
  • 3.5 SP1
  • 4.6
  • 4.7
  • 4.8

Nuevos formatos de exportación

CaracterísticaDescripción
JSONJSON (JavaScript Object Notation) es un formato de archivo estándar abierto e independiente del lenguaje para transmitir objetos de datos compuestos por pares atributo-valor y tipos de datos de matriz. FineReader Engine ahora admite la exportación de resultados de Reconocimiento óptico de caracteres (OCR) en formato JSON.
Nuevas versiones de ALTOALTO (Analyzed Layout and Text Object) es un esquema XML que define metadatos técnicos para describir la estructura y el contenido de recursos textuales físicos, como las páginas de un libro o un periódico. Las versiones más recientes de este esquema (4.0, 4.1 y 4.2) son compatibles con FineReader Engine 12.
PDF/A-2b y PDF/A-3bPDF/A es una versión del Portable Document Format (PDF) estandarizada por ISO, especializada en el archivado y la conservación a largo plazo de documentos electrónicos. Ahora, FineReader Engine admite todos los niveles de conformidad de PDF/A.
DoclangDoclang es un formato XML optimizado para IA diseñado para representar la estructura de los documentos de forma semánticamente significativa para los flujos modernos de IA, incluida la ingesta en LLM, los sistemas RAG para documentos y los flujos de trabajo estructurados de procesamiento de documentos.
Disponible a partir de la versión 12.8.0.

Funcionalidad completa