Lorsque vous travaillez avec des documents papier, vous devez repérer et corriger les erreurs ou les modifications apportées intentionnellement. Utilisez l’API Document Comparison pour rechercher ces modifications rapidement et efficacement. Ce scénario permet de comparer des documents particulièrement importants, tels que des contrats et des documents bancaires, avec leurs copies. Le résultat de la comparaison contient des informations sur les différences de type de contenu (texte uniquement), de type de modification (supprimé, inséré ou modifié) et sur leur emplacement dans l’original et dans la copie. Vous pouvez obtenir la liste des différences détectées ou la région de n’importe quelle modification, puis enregistrer le résultat de la comparaison dans un fichier externe pour un traitement ultérieur ou un stockage à long terme. Pour comparer des documents ou des pages, les fichiers obtenus par numérisation ou enregistrés au format électronique passent généralement par plusieurs étapes de traitement, chacune présentant ses propres particularités :Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
- Prétraitement des fichiers numérisés ou des images
- Reconnaissance avec restauration complète de la structure et de la mise en forme du document
- Comparaison des documents ou des pages
- Exportation vers un format externe
Implémentation du scénario
Les exemples de code fournis dans cette rubrique sont spécifiques à Windows.
Étape 1. Chargement d’ABBYY FineReader Engine
Étape 1. Chargement d’ABBYY FineReader Engine
Pour commencer à travailler avec ABBYY FineReader Engine, vous devez créer l’objet Engine. L’objet Engine est l’objet racine de la hiérarchie des objets d’ABBYY FineReader Engine et fournit différents paramètres globaux, certaines méthodes de traitement, ainsi que des méthodes permettant de créer les autres objets.Pour créer l’objet Engine, vous pouvez utiliser la fonction InitializeEngine. Voir aussi d’autres façons de charger l’objet Engine (Win).
C#
Étape 2. Chargement et prétraitement des fichiers et images
Étape 2. Chargement et prétraitement des fichiers et images
ABBYY FineReader Engine fournit l’objet FRDocument, qui permet de traiter des documents multipages. L’utilisation de cet objet vous permet de préserver l’organisation logique du document en conservant le texte et les colonnes d’origine, les polices, les styles, etc. Utilisez l’objet FRPage si vous souhaitez comparer des pages.Pour charger les images d’un même document et les prétraiter, vous devez créer l’objet FRDocument et y ajouter les images. Vous pouvez procéder de l’une des façons suivantes :
- Créez l’objet FRDocument à l’aide de la méthode CreateFRDocumentFromImage de l’objet Engine. Cette méthode crée l’objet FRDocument et charge les images à partir du fichier spécifié.
- Créez l’objet FRDocument à l’aide de la méthode CreateFRDocument de l’objet Engine, puis ajoutez des images à l’objet FRDocument créé à partir d’un fichier (utilisez les méthodes AddImageFile, AddImageFileWithPassword ou AddImageFileWithPasswordCallback de l’objet FRDocument).
C#
Étape 3. Reconnaissance du document
Étape 3. Reconnaissance du document
Pour reconnaître un document, nous vous recommandons d’utiliser les méthodes d’analyse et de reconnaissance de l’objet FRDocument. Cet objet fournit toute une série de méthodes pour l’analyse, la reconnaissance et la synthèse de documents. La méthode la plus pratique, qui combine l’analyse, la reconnaissance et la synthèse du document en une seule opération, est la méthode Process. Elle exploite également de la manière la plus efficace les fonctionnalités de traitement simultané des systèmes multiprocesseurs et multicœurs. Toutefois, vous pouvez aussi exécuter successivement le prétraitement, l’analyse, la reconnaissance et la synthèse à l’aide des méthodes Preprocess, Analyze, Recognize et Synthesize.
Vous pouvez définir les paramètres de reconnaissance de vos documents en chargeant un profil prédéfini approprié (consultez Working with Profiles pour plus d’informations).
Vous pouvez définir les paramètres de reconnaissance de vos documents en chargeant un profil prédéfini approprié (consultez Working with Profiles pour plus d’informations).
C#
Étape 4. Comparaison des documents ou des pages
Étape 4. Comparaison des documents ou des pages
Pour comparer les documents ou les pages à leurs copies :
- Assurez-vous que votre licence ABBYY FineReader Engine prend en charge le module Compare Documents.
- Créez un objet Comparator à l’aide de la méthode CreateComparator de l’objet Engine.
- [facultatif] Utilisez l’objet ComparisonParams pour définir les propriétés selon les valeurs souhaitées.
- Appelez la méthode CompareDocuments de l’objet Comparator pour comparer le document original à sa copie. Vous recevrez un objet ComparisonResult contenant des informations sur les modifications détectées.
C#
Étape 5. Exploitation des modifications détectées
Étape 5. Exploitation des modifications détectées
L’objet ComparisonResult contient la liste complète des différences et fournit des méthodes permettant d’obtenir les différences pour des pages individuelles. Vous pouvez accéder aux modifications du document original et de sa copie à l’aide des méthodes GetChangesForReferencePage et GetChangesForUserPage. Utilisez l’objet ChangeLocation pour obtenir des informations sur l’emplacement de la modification, ainsi que sa propriété RegionForPage pour obtenir la région de la modification sur la page spécifiée.
C#
Étape 6. Exportation du résultat de la comparaison
Étape 6. Exportation du résultat de la comparaison
Pour exporter le résultat de la comparaison, appelez la méthode Export de l’objet ComparisonResult et transmettez le chemin d’accès du fichier comme paramètre d’entrée. Les données peuvent être enregistrées dans un fichier XML ou DOCX avec suivi des modifications.C#
Étape 7. Déchargement d’ABBYY FineReader Engine
Étape 7. Déchargement d’ABBYY FineReader Engine
Une fois que vous avez fini d’utiliser ABBYY FineReader Engine, vous devez décharger l’objet Engine. Pour cela, utilisez la fonction exportée DeinitializeEngine.
C#
Ressources requises
Optimisations supplémentaires pour des tâches spécifiques
- Numérisation - Windows uniquement
- Numérisation
Description du scénario ABBYY FineReader Engine pour la numérisation de documents.
- Numérisation
- Reconnaissance
- Réglage des paramètres de prétraitement, d’analyse, de reconnaissance et de synthèse
Personnalisation du traitement des documents à l’aide d’objets de paramètres d’analyse, de reconnaissance et de synthèse. - Objet PageProcessingParams
Cet objet permet de personnaliser les paramètres d’analyse et de reconnaissance. À l’aide de cet objet, vous pouvez indiquer quelles caractéristiques de l’image et du texte doivent être détectées (image inversée, orientation, codes-barres, langue de reconnaissance, marge d’erreur de reconnaissance). - Objet SynthesisParamsForPage
Cet objet inclut les paramètres permettant de restaurer la mise en forme d’une page lors de la synthèse. - Objet SynthesisParamsForDocument
Cet objet permet de personnaliser la synthèse du document : restauration de sa structure et de sa mise en forme. - Objet MultiProcessingParams - Disponible sous Linux et Windows
Le traitement simultané peut être utile lors du traitement d’un grand nombre d’images. Dans ce cas, la charge de traitement est répartie entre les cœurs du processeur pendant l’ouverture et le prétraitement des images, l’analyse de la mise en page, la reconnaissance et l’exportation, ce qui permet d’accélérer le traitement.
Les modes de traitement (simultané ou séquentiel) sont définis à l’aide de la propriété MultiProcessingMode. La propriété RecognitionProcessesCount contrôle le nombre de processus pouvant être démarrés.
- Réglage des paramètres de prétraitement, d’analyse, de reconnaissance et de synthèse
