Passer au contenu principal

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

Cet objet permet d’accéder à différents paramètres d’un caractère unique dans le texte reconnu : sa mise en forme, son rectangle dans l’image, sa langue de reconnaissance et les hypothèses de reconnaissance. Toutes les propriétés booléennes d’un objet de ce type nouvellement créé sont définies sur FALSE.
Si vous souhaitez utiliser les paramètres d’un caractère donné dans le texte reconnu, vous devez d’abord appeler l’une des fonctions qui effectuent la synthèse (par exemple, la méthode Process ou Synthesize de l’objet FRDocument), car ces paramètres ne prennent sens qu’après la synthèse.
Si le caractère provient du texte d’une carte de visite, seules les propriétés suivantes de l’objet sont définies :
  • BaseLine
  • Bottom
  • Left
  • Right
  • Top
  • IsSuspicious
  • ErrorProbability
  • CharacterRegion
  • CharacterRecognitionVariantIndex
  • CharacterRecognitionVariants
  • SelectedCharacterRecognitionVariant
  • WordRecognitionVariants
  • IsFromSourceContent
  • IsWordFirst
  • IsWordLeftmost

Propriétés

,lecture seule

Retourne l’objet Engine.

Spécifie l’identifiant de la langue du caractère. Pour le convertir en LCID Win32, utilisez la méthode.

Par défaut, cette propriété est initialisée avec l’identifiant de langue par défaut du système.

Stocke le nom interne de la langue associée à un caractère et permet de le définir.

Si une seulelangue de reconnaissance de basecorrespond à un mot reconnu, la propriété LanguageName de chaque caractère de ce mot est définie sur le nom interne de la langue de base après la reconnaissance. Si plusieurs langues de reconnaissance de base correspondent à un même mot (par exemple, pour les mots composés bilingues), la propriété LanguageName des caractères de ce mot est vide. En revanche, la propriété LanguageId contient toujours l’identifiant de la langue de base, quel que soit le mot reconnu.

Par défaut, la valeur de cette propriété est une chaîne vide.

Spécifie la région exacte du caractère. Cette région peut ne pas être rectangulaire et est initialement contenue dans le rectangle défini par les propriétés Left, Top, Right et Bottom. Si vous modifiez la région exacte du caractère, les propriétés Left, Top, Right et Bottom ne sont pas modifiées.

Cette propriété n’est disponible qu’après la reconnaissance, avec la propriétédéfinie sur TRUE.

Cette propriété retourne un objet constant. Pour modifier la région exacte du caractère, vous devez d’abord obtenir un objet Region intermédiaire à l’aide de la méthodeIEngine::CreateRegion, modifier les paramètres nécessaires, puis assigner l’objet obtenu à la propriété.

, lecture seule

Stocke la coordonnée du bord inférieur du rectangle du caractère. Ce rectangle est défini sur l’image, sans tenir compte de l’orientation du texte. Il peut être indéfini, auquel cas les quatre coordonnées sont égales à zéro. Cette propriété ne peut pas être modifiée directement ; elle ne peut l’être qu’au moyen de la méthode SetRect.

La valeur par défaut de cette propriété est 0.

, lecture seule

Stocke la coordonnée du bord gauche du rectangle du caractère. Ce rectangle est défini sur l’image, sans tenir compte de l’orientation du texte. Il peut être indéfini, auquel cas les quatre coordonnées sont égales à zéro. Cette propriété ne peut pas être modifiée directement ; elle ne peut l’être qu’au moyen de la méthode SetRect.

La valeur par défaut de cette propriété est 0.

, lecture seule

Stocke la coordonnée du bord droit du rectangle du caractère. Ce rectangle est défini sur l’image, sans tenir compte de l’orientation du texte. Il peut être indéfini, auquel cas les quatre coordonnées sont égales à zéro. Cette propriété ne peut pas être modifiée directement ; elle ne peut l’être qu’au moyen de la méthode SetRect.

La valeur par défaut de cette propriété est 0.

, lecture seule

Stocke la coordonnée du bord supérieur du rectangle du caractère. Ce rectangle est défini sur l’image, indépendamment de l’orientation du texte. Il peut être indéfini, auquel cas ses quatre coordonnées sont égales à zéro. Cette propriété ne peut pas être modifiée directement, mais uniquement via la méthode SetRect.

La valeur par défaut de cette propriété est 0.

Indique si le caractère est le caractère le plus à gauche dans un mot.

Dans des situations complexes (par exemple, deux mots non séparés par une espace, ou un mot contenant un signe de ponctuation sans espaces), cette propriété peut ne pas fonctionner correctement. Le moteur de reconnaissance peut modifier l’hypothèse sur le nombre de mots une fois que les indicateurs des caractères ont été définis.

Cette propriété est définie lors de la synthèse. Si elle est appelée avant la fin de la synthèse, sa valeur par défaut est FALSE.

Pour lechinois, le japonais ou le coréen, cette propriété n’est pas fiable, car les mots ne sont pas détectés.

Indique si le caractère est le premier caractère dans un mot.

Cette propriété est définie lors de la synthèse. Si elle est appelée avant la fin de la synthèse, sa valeur par défaut est FALSE.

Remarques :

  • Pour les langues dont le sens d’écriture est de droite à gauche (par exemple, l’hébreu), cette propriété désigne le caractère le plus à droite dans le mot.
  • Pour lechinois, le japonais ou le coréen, cette propriété n’est pas fiable, car les mots ne sont pas détectés.

Définit le décalage d’un caractère par rapport à la ligne de base de la chaîne, en pixels. La ligne de base de la chaîne est définie par la propriété. Cette propriété est principalement utilisée pour les images intégrées dans le texte.

Par défaut, la valeur de cette propriété est 0.

Spécifie l’espacement supplémentaire entre les caractères, en twips. Un twip correspond à 1/20 de point, et un point correspond à 1/72”.

La valeur par défaut de cette propriété est 0.

Stocke la mise à l’échelle horizontale d’un caractère, en 1/1000.

Si le caractère est extrait du texte d’une carte de visite, cette propriété prend sa valeur par défaut.

La valeur par défaut est 1000, ce qui correspond à l’absence de mise à l’échelle.

Définit la valeur RVB de la couleur du symbole. La couleur d’arrière-plan est définie pour l’ensemble du paragraphe par la propriété.

La valeur de cette propriété peut être -1, ce qui indique que la couleur est transparente.

La valeur int est calculée à partir du triplet RVB selon la formule : ( valeur rouge ) + (256 × valeur verte ) + (65536 × valeur bleue ), où la valeur rouge est le premier composant du triplet, la valeur verte est le deuxième composant et la valeur bleue est le troisième composant. Par exemple, la valeur int de la couleur blanche est 16777215.

Par défaut, la couleur du texte est le noir, soit RVB(0,0,0).

Indique si le caractère est en gras.

Si le caractère provient du texte d’une carte de visite, cette propriété prend sa valeur par défaut.

Cette propriété vaut FALSE par défaut.

Indique si le caractère est en italique.

Si le caractère provient du texte d’une carte de visite, cette propriété prend sa valeur par défaut.

Cette propriété vaut FALSE par défaut.

Indique si le caractère est souligné.

Cette propriété vaut FALSE par défaut.

Indique si le caractère est barré.

Si le caractère provient du texte d’une carte de visite, cette propriété prend sa valeur par défaut.

Cette propriété vaut FALSE par défaut.

Indique si le caractère est en indice. Cette propriété ne peut pas être définie sur TRUE simultanément avec la propriété IsSuperscript, car cela entraînerait des erreurs lors de l’export du texte reconnu.

Si le caractère provient du texte d’une carte de visite, cette propriété prend sa valeur par défaut.

Cette propriété vaut FALSE par défaut.

Indique si le caractère est en exposant. Cette propriété ne peut pas être définie sur TRUE simultanément avec la propriété IsSubscript, car cela entraînerait des erreurs lors de l’export du texte reconnu.

Si le caractère provient du texte d’une carte de visite, cette propriété prend sa valeur par défaut.

Cette propriété vaut FALSE par défaut.

Indique si le caractère utilise le style “petites majuscules”. Cela signifie que les petits caractères sont affichés en petites capitales.

Cette propriété vaut FALSE par défaut.

, lecture seule

Contient le nom de la police d’un caractère. Cette propriété ne peut pas être modifiée directement, mais via la méthode SetFont.

Par défaut, cette valeur est “Times New Roman”.

Indique la hauteur de la police du caractère en twips. Un twip correspond à 1/20 de point, et un point à 1/72”.

La valeur par défaut de cette propriété correspond à 10 points ou 200 twips.

Donne accès au style de police du caractère.

, lecture seule

Contient le type de police d’un caractère. Cette propriété ne peut pas être modifiée directement, mais via la méthode SetFont.

Par défaut, cette valeur est FT_Unknown.

Retourne TRUE si le caractère a été reconnu de manière peu fiable. Utilisez cette propriété pour déterminer si une vérification est nécessaire.

Cette propriété est calculée à partir de la valeur ErrorProbability et des paramètres de reconnaissance. Si vous avez besoin d’établir des distinctions plus fines pour la vérification, utilisez plutôt ErrorProbability.

Cette propriété est FALSE par défaut.

, lecture seule

Retourne la probabilité estimée (dans une plage de 0 à 100) que le caractère ait été reconnu incorrectement.

La probabilité d’erreur tient compte du contexte global, c’est pourquoi elle n’est disponible que pour le résultat de la reconnaissance, et non pour chaque variante de reconnaissance de caractère. Pour comparer les variantes de reconnaissance entre elles, utilisez.

La probabilité d’erreur n’est pas calculée pour les symboles obtenus sans reconnaissance, par exemple ceux extraits directement du fichier PDF source.

,lecture seule

Retourne une collection de variantes de reconnaissance de caractère.

La propriété contient zéro pour les caractères non imprimables (espaces, retours chariot, etc.) et les caractères qui n’ont pas été reconnus mais ajoutés au texte lors d’une édition explicite. Zéro est également retourné si le texte a été reconnu par l’une des versions précédentes d’ABBYY FineReader Engine.

Si la propriétéest définie sur FALSE, la collection retournée contient un seul élément ; sinon, la collection contient au moins un élément et les variantes sont classées de la meilleure à la moins bonne.

, lecture seule

Stocke l’indice de la variante de reconnaissance de caractère sélectionnée dans la collection CharacterRecognitionVariants.

,lecture seule

Stocke la variante de reconnaissance de caractère sélectionnée. Il s’agit de l’élément dont l’indice est CharacterRecognitionVariantIndex dans la collection des variantes de reconnaissance de caractère (la propriété CharacterRecognitionVariants).

,lecture seule

Retourne une collection de variantes de reconnaissance pour le mot auquel appartient le caractère.

La propriété contient zéro pour les caractères non imprimables (espaces, retours chariot, etc.) et les caractères qui n’ont pas été reconnus mais ajoutés au texte lors d’une édition explicite. Zéro est également retourné si le texte a été reconnu par l’une des versions précédentes d’ABBYY FineReader Engine.

Si la propriétéest définie sur FALSE, la collection retournée contient un seul élément ; sinon, la collection contient au moins un élément et les variantes sont classées de la meilleure à la moins bonne, selon le mécanisme d’estimation interne.

, lecture seule

Indique si le caractère a été extrait du contenu textuel du fichier d’entrée sans reconnaissance. Par exemple, il peut être extrait d’un fichier PDF comportant un calque de texte.

Indique si une vérification orthographique a été effectuée sur ce caractère. Ce paramètre n’est ni utilisé ni défini en interne par ABBYY FineReader Engine ; il vous fournit simplement un cadre pour la correction orthographique.

Méthodes

NomDescription
CopyFromInitialise les propriétés de l’objet courant avec les valeurs des propriétés correspondantes d’un autre objet.
SetFontDéfinit une nouvelle police pour le symbole.
SetRectDéfinit un nouveau Rectangle pour le symbole.
CharParams Diagramme d’objets

Paramètre de sortie

Cet objet est le paramètre de sortie des méthodes suivantes :

Paramètre d’entrée

Cet objet est passé en tant que paramètre d’entrée aux méthodes suivantes :

Exemples

int suspiciousCharsCount = 0;
// Calcule le nombre de caractères suspects dans un bloc de texte
void computeStatisticsForBlock(FREngine.IBlock block)
{
 if (block.Type == FREngine.BlockTypeEnum.BT_Text)
 {
  FREngine.ITextBlock textBlock = block.GetAsTextBlock();
  int paragraphsCount = textBlock.Text.Paragraphs.Count;
  for (int iPar = 0; iPar < paragraphsCount; iPar++)
  {
   FREngine.IParagraph par = textBlock.Text.Paragraphs[iPar];
   string text = par.Text;
   FREngine.ICharParams charParams = engine.CreateCharParams();
   for (int iChar = 0; iChar < text.Length; iChar++)
   {
    par.GetCharParams(iChar, charParams);
    if (charParams.IsSuspicious)
    {
     suspiciousCharsCount++;
    }
   }
  }
 }
}
L’objet est utilisé dans les exemples de code suivants : RecognizedTextProcessing (Win), ainsi que dans les Demo Tools Windows : Engine Predefined Processing Profiles.

Voir aussi

Paragraph Quelle est la différence entre CharConfidence, ErrorProbability et IsSuspicious ? Utilisation du texte Utilisation des propriétés