Al trabajar con documentos en papel, es necesario encontrar y corregir errores o cambios realizados intencionadamente. Use la API de comparación de documentos para localizar estos cambios de forma rápida y eficaz. Este escenario se utiliza para comparar documentos de especial importancia, como contratos y documentación bancaria, con sus copias. El resultado de la comparación contiene información sobre las diferencias en el tipo de contenido (solo texto), el tipo de modificación (eliminado, insertado o modificado) y su ubicación en el original y en la copia. Puede obtener la lista de diferencias detectadas o la región de cualquier cambio, y guardar el resultado de la comparación en un archivo externo para su posterior procesamiento o almacenamiento a largo plazo. Para comparar documentos o páginas, los archivos obtenidos mediante escaneo o guardados en formato electrónico suelen pasar por varias etapas de procesamiento, cada una con sus propias particularidades:Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
- Preprocesamiento de archivos escaneados o imágenes Los archivos y sus copias requieren cierto preprocesamiento antes del reconocimiento si presentan defectos o anotaciones hechas intencionadamente, como firmas o sellos.
- Reconocimiento con restauración completa de la estructura y el formato del documento Al reconocer un documento, se identifican varios elementos de diseño (texto, tablas, imágenes, separadores, etc.) del documento. Durante la síntesis del documento, se restaura su estructura lógica, mientras que la síntesis de la página permite restaurar por completo el formato del documento (fuentes, estilos, etc.)
- Comparación de documentos o páginas Para comparar documentos o páginas con sus copias, use archivos reconocidos con ABBYY FineReader Engine. Puede usar dos versiones de un documento en formatos distintos. Tras la comparación, obtendrá un resultado con la lista de cambios; úselo para recuperar información sobre la ubicación de esos cambios. Si utiliza verificación manual, use esta información para resaltar los cambios en el texto y facilitar así el trabajo del operador.
- Exportación a un formato externo También puede guardar el resultado de la comparación en formato XML y DOCX.
Implementación del escenario
Los ejemplos de código proporcionados en este tema son específicos de Windows.
Paso 1. Carga de ABBYY FineReader Engine
Paso 1. Carga de ABBYY FineReader Engine
Para empezar a trabajar con ABBYY FineReader Engine, debe crear el objeto Engine. El objeto Engine es el objeto superior en la jerarquía de objetos de ABBYY FineReader Engine y proporciona varias configuraciones globales, algunos métodos de procesamiento y métodos para crear los demás objetos.Para crear el objeto Engine, puede usar la función InitializeEngine. Consulte también otras formas de cargar el objeto Engine (Win).
C#
Paso 2. Carga y preprocesamiento de archivos e imágenes
Paso 2. Carga y preprocesamiento de archivos e imágenes
ABBYY FineReader Engine proporciona el objeto FRDocument, que permite procesar documentos de varias páginas. El uso de este objeto le permite conservar la organización lógica del documento y mantener el texto original, así como las columnas, fuentes, estilos, etc. Use el objeto FRPage si desea comparar páginas.Para cargar imágenes de un solo documento y preprocesarlas, debe crear el objeto FRDocument y agregarle las imágenes. Puede hacerlo de una de las siguientes maneras:
- Crear el objeto FRDocument mediante el método CreateFRDocumentFromImage del objeto Engine. Este método crea el objeto FRDocument y carga las imágenes desde el archivo especificado.
- Crear el objeto FRDocument mediante el método CreateFRDocument del objeto Engine y, a continuación, agregar imágenes desde un archivo al objeto FRDocument creado (use el método AddImageFile, AddImageFileWithPassword o AddImageFileWithPasswordCallback del objeto FRDocument).
C#
Paso 3. Reconocimiento de documentos
Paso 3. Reconocimiento de documentos
Para reconocer un documento, le recomendamos usar los métodos de análisis y reconocimiento del objeto FRDocument. Este objeto proporciona toda una serie de métodos para analizar, reconocer y sintetizar documentos. El método más práctico, que integra en una sola operación el análisis, el reconocimiento y la síntesis del documento, es Process. Además, aprovecha de la forma más eficiente las funciones de procesamiento simultáneo de los sistemas multiprocesador y multinúcleo. No obstante, también puede realizar de forma secuencial el preprocesamiento, el análisis, el reconocimiento y la síntesis mediante los métodos Preprocess, Analyze, Recognize y Synthesize.
Puede establecer los parámetros de reconocimiento para sus documentos cargando un profile predefinido adecuado (consulte Working with Profiles para obtener más información).
Puede establecer los parámetros de reconocimiento para sus documentos cargando un profile predefinido adecuado (consulte Working with Profiles para obtener más información).
C#
Paso 4. Comparación de documentos o páginas
Paso 4. Comparación de documentos o páginas
Para comparar los documentos o páginas con sus copias:
- Asegúrese de que su licencia de ABBYY FineReader Engine sea compatible con el módulo Compare Documents.
- Cree un objeto Comparator mediante el método CreateComparator del objeto Engine.
- [opcional] Use el objeto ComparisonParams para configurar las propiedades con los valores que necesite.
- Llame al método CompareDocuments del objeto Comparator para comparar el documento original con la copia. Recibirá un objeto ComparisonResult que contiene información sobre los cambios detectados.
C#
Paso 5. Trabajo con los cambios detectados
Paso 5. Trabajo con los cambios detectados
El objeto ComparisonResult contiene la lista completa de diferencias y proporciona métodos para obtener las diferencias de páginas concretas. Puede acceder a los cambios del documento original y de su copia con los métodos GetChangesForReferencePage y GetChangesForUserPage. Use el objeto ChangeLocation para obtener información sobre la ubicación del cambio y su propiedad RegionForPage para obtener la región del cambio en la página especificada.
C#
Paso 6. Exportación del resultado de la comparación
Paso 6. Exportación del resultado de la comparación
Para exportar el resultado de la comparación, llame al método Export del objeto ComparisonResult y pase la ruta del archivo como parámetro de entrada. Los datos pueden guardarse en XML o en un archivo DOCX con control de cambios.C#
Paso 7. Descarga de ABBYY FineReader Engine
Paso 7. Descarga de ABBYY FineReader Engine
Después de terminar de trabajar con ABBYY FineReader Engine, debe descargar el objeto Engine. Para ello, use la función exportada DeinitializeEngine.
C#
Recursos necesarios
Optimización adicional para tareas específicas
- Escaneo: solo para Windows
- Escaneo
Descripción del escenario de ABBYY FineReader Engine para el escaneo de documentos.
- Escaneo
- Reconocimiento
- Ajuste de los parámetros de preprocesamiento, análisis, reconocimiento y síntesis
Personalización del procesamiento de documentos mediante objetos de parámetros de análisis, reconocimiento y síntesis. - PageProcessingParams Object
Este objeto permite personalizar los parámetros de análisis y reconocimiento. Con este objeto, puede indicar qué características de la imagen y del texto deben detectarse (imagen invertida, orientación, códigos de barras, idioma de reconocimiento, margen de error de reconocimiento). - SynthesisParamsForPage Object
Este objeto incluye parámetros responsables de restaurar el formato de una página durante la síntesis. - SynthesisParamsForDocument Object
Este objeto permite personalizar la síntesis del documento: restaurar su estructura y formato. - MultiProcessingParams Object - Implementado para Linux y Windows
El procesamiento simultáneo puede resultar útil al procesar una gran cantidad de imágenes. En este caso, la carga de procesamiento se distribuirá entre los núcleos del procesador durante la apertura y el preprocesamiento de las imágenes, el análisis del diseño, el reconocimiento y la exportación, lo que permite acelerar el procesamiento.
Los modos de lectura (simultáneo o consecutivo) se configuran mediante la propiedad MultiProcessingMode. La propiedad RecognitionProcessesCount controla la cantidad de procesos que pueden iniciarse.
- Ajuste de los parámetros de preprocesamiento, análisis, reconocimiento y síntesis
