El resultado de este escenario es una versión editable de un documento. En este escenario, se reconocen imágenes de documentos y se conserva intacto todo el formato original; luego, los datos se guardan en un formato de archivo editable. Como resultado, obtiene versiones editables de sus documentos, que pueden revisarse fácilmente para detectar errores y modificarse. También podrá copiar todo o parte del texto para reutilizarlo. Un documento pasa por varias etapas de procesamiento, que en algunos aspectos difieren ligeramente de las de otros escenarios habituales:Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
- Preprocesamiento de imágenes escaneadas o fotografías
- Reconocimiento con restauración completa de la estructura y el formato del documento
- Exportación a un formato editable
Implementación del escenario
Los ejemplos de código proporcionados en este tema son específicos de Windows.
Paso 1. Cargar ABBYY FineReader Engine
Paso 1. Cargar ABBYY FineReader Engine
Para comenzar a trabajar con ABBYY FineReader Engine, es necesario crear el objeto Engine. El objeto Engine es el objeto de nivel superior en la jerarquía de objetos de ABBYY FineReader Engine y proporciona diversas configuraciones globales, algunos métodos de procesamiento y métodos para crear los demás objetos.Para crear el objeto Engine, puede usar la función InitializeEngine. Consulte también otras formas de cargar el objeto Engine (Win).
C#
C++ (COM)
Paso 2. Carga de la configuración para este escenario
Paso 2. Carga de la configuración para este escenario
ABBYY FineReader Engine permite cargar la configuración más adecuada para este escenario mediante el método LoadPredefinedProfile del objeto Engine. Este método recibe el nombre del perfil como parámetro de entrada. Consulte Uso de perfiles para obtener más información.ABBYY FineReader Engine admite 2 variantes de configuración para este escenario:
Si desea cambiar la configuración de procesamiento, use los objetos Parameter adecuados. Consulte Optimización adicional para tareas específicas más abajo para obtener más información.
Nombre del perfil | Descripción |
|---|---|
DocumentConversion_Accuracy | La configuración se ha optimizado para la precisión:
|
DocumentConversion_Normal | La configuración se ha optimizado para la velocidad de procesamiento:
|
C#
C++ (COM)
Paso 3. Carga y preprocesamiento de imágenes
Paso 3. Carga y preprocesamiento de imágenes
ABBYY FineReader Engine proporciona el objeto FRDocument, que permite procesar documentos de varias páginas. El uso de este objeto le permite conservar la organización lógica del documento y mantener el texto original, las columnas, las fuentes, los estilos, etc.Para cargar imágenes de un solo documento y preprocesarlas, debe crear el objeto FRDocument y agregarle imágenes. Puede realizar una de las siguientes acciones:
- Cree el objeto FRDocument mediante el método CreateFRDocumentFromImage del objeto Engine. Este método crea el objeto FRDocument y carga imágenes desde el archivo especificado.
- Cree el objeto FRDocument con el método CreateFRDocument del objeto Engine y, a continuación, agregue imágenes al objeto FRDocument creado desde un archivo (use el método AddImageFile, AddImageFileWithPassword o AddImageFileWithPasswordCallback del objeto FRDocument).
C#
C++ (COM)
El preprocesamiento de imágenes con el perfil DocumentConversion_Normal cargado no incluye la detección de la orientación. Si desea que la orientación de la imagen se detecte automáticamente, deberá configurar parámetros adicionales y pasar el objeto correspondiente a la función de preprocesamiento. Consulte Optimización adicional para tareas específicas más abajo para obtener más información.
Paso 4. Reconocimiento de documentos
Paso 4. Reconocimiento de documentos
Para reconocer un documento, le recomendamos usar los métodos de análisis y reconocimiento del objeto FRDocument. Este objeto ofrece toda una gama de métodos para el análisis, reconocimiento y síntesis de documentos. El método más práctico, que combina el análisis, el reconocimiento y la síntesis de documentos en una sola operación, es Process. Además, aprovecha de la forma más eficiente las funciones de procesamiento simultáneo de los sistemas multiprocesador y multinúcleo. No obstante, también puede realizar de forma secuencial el preprocesamiento, el análisis, el reconocimiento y la síntesis mediante los métodos Preprocess, Analyze, Recognize y Synthesize.
C#
C++ (COM)
Paso 5. Exportación de documentos
Paso 5. Exportación de documentos
Para guardar un documento reconocido, puede usar el método Export del objeto FRDocument y especificar la constante FileExportFormatEnum como uno de los parámetros. Puede cambiar los parámetros predeterminados de exportación mediante el objeto de exportación correspondiente. Consulte Optimización adicional para tareas específicas más abajo para obtener más información.Cuando haya terminado de trabajar con el objeto FRDocument, libere todos los recursos utilizados por este objeto. Use el método IFRDocument::Close.
C#
C++ (COM)
Paso 6. Descarga de ABBYY FineReader Engine
Paso 6. Descarga de ABBYY FineReader Engine
Después de terminar de trabajar con ABBYY FineReader Engine, debe descargar el objeto Engine. Para ello, use la función exportada DeinitializeEngine.
C#
C++ (COM)
Recursos necesarios
Optimización adicional para tareas específicas
- Escaneo - Solo Windows
- Escaneo
Descripción del escenario de ABBYY FineReader Engine para el escaneo de documentos.
- Escaneo
- Reconocimiento
- Ajuste de los parámetros de preprocesamiento, análisis, reconocimiento y síntesis
Personalización del procesamiento de documentos mediante objetos de parámetros de análisis, reconocimiento y síntesis. - Reconocer escritura a mano
Los perfiles DocumentConversion_*** no incluyen el reconocimiento de texto manuscrito ni escrito a mano en letra de molde. Si necesita reconocer escritura a mano, establezca la propiedad DetectHandwritten del objeto PageAnalysisParams en TRUE. - PageProcessingParams Object
Este objeto permite personalizar los parámetros de análisis y reconocimiento. Con este objeto, puede indicar qué características de la imagen y del texto deben detectarse (imagen invertida, orientación, códigos de barras, idioma de reconocimiento, margen de error de reconocimiento). - SynthesisParamsForPage Object
Este objeto incluye los parámetros responsables de restaurar el formato de una página durante la síntesis. - SynthesisParamsForDocument Object
Este objeto permite personalizar la síntesis del documento: la restauración de su estructura y formato. - MultiProcessingParams Object - Implementado para Linux y Windows
El procesamiento simultáneo puede ser útil al procesar una gran cantidad de imágenes. En este caso, la carga de procesamiento se distribuirá entre los núcleos del procesador durante la apertura y el preprocesamiento de imágenes, el análisis del diseño, el reconocimiento y la exportación, lo que permitirá acelerar el procesamiento.
Los modos de procesamiento (simultáneo o consecutivo) se establecen mediante la propiedad MultiProcessingMode. La propiedad RecognitionProcessesCount controla la cantidad de procesos que pueden iniciarse.
- Ajuste de los parámetros de preprocesamiento, análisis, reconocimiento y síntesis
- Exportación
- Ajuste de los parámetros de exportación
Personalización de la exportación de documentos mediante objetos de parámetros de exportación. - RTFExportParams Object
Este objeto permite personalizar los parámetros del formato de guardado RTF/DOCX/ODT. - HTMLExportParams Object
Este objeto permite personalizar la exportación al formato HTML. - PPTExportParams Object
Objeto para personalizar los parámetros del formato de guardado PPTX.
- Ajuste de los parámetros de exportación
