Vai al contenuto principale

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

Un field di testo estrae un valore stringa da un documento — ad esempio un nome, un indirizzo, un ID o altro testo. Il tipo di dati del field (Testo, Date, Number o Money) determina come Vantage riconosce e convalida il valore.”

Aggiungi un field di testo

Puoi aggiungere un field di testo in due modi.

Delimita una regione sull’immagine del documento

Fai clic su un valore (evidenziato in verde al passaggio del mouse), oppure trascina un rettangolo attorno ad esso. Il nuovo field appare nel modulo dati.

Aggiungi un field vuoto, quindi contrassegnane la regione

Fai clic su Add Field nella barra degli strumenti, quindi trascina un rettangolo attorno al valore sull’immagine. Il contenuto all’interno della regione diventa il valore del field.
Per rinominare un field, fai doppio clic sul nome nel modulo dati oppure fai clic sul nome nelle proprietà del field. Fai triplo clic per selezionare l’intero nome. Per aprire le proprietà del field, fai clic su Field options.

Aggiungere più regioni a un field

Alcuni valori si estendono su più righe o pagine, quindi un singolo field può richiedere più regioni. Per aggiungere più regioni a un nuovo field:
1

Aggiungi il field

Usa uno dei metodi sopra.
2

Seleziona altre regioni

Tieni premuto Shift e fai clic oppure trascina altre regioni per lo stesso field.
Per aggiungere regioni a un field esistente, seleziona il field nel modulo dati, quindi fai clic oppure trascina sulla sua posizione nell’immagine. Se il valore si estende su più parole, selezionale tutte come un’unica regione. Le regioni possono estendersi su più pagine o trovarsi all’interno di un’altra regione. Una regione annidata viene evidenziata con un colore più scuro; quando è selezionata, viene evidenziata in giallo.

Proprietà generali

ProprietàDescrizione
Nome del fieldUnivoco all’interno della skill. Non può contenere: . , / : * ? " < > |. Lunghezza massima: 90 caratteri.
Tipo di datiIl tipo di dati contenuti nel field. Influisce sull’accuratezza del riconoscimento. Vedi Tipi di dati per le opzioni.
Consenti più elementiIndica se il field si ripete (ad esempio, più nomi di figli o numeri di conto).
Field obbligatorioSe abilitato e il field è vuoto dopo l’estrazione, il documento viene inviato alla revisione manuale con un errore.
Field chiaveContrassegna il valore come ricercabile — utilizzato per trovare i documenti.
Field di dimensioneEspone il valore come dimensione per la reportistica in Skill Monitor.

Tipi di dati

Tipo di datiDescrizione
TestoPuò contenere lettere latine e cirilliche, cifre, ideogrammi e caratteri speciali.
DateData e ora in qualsiasi formato. I seguenti caratteri possono essere utilizzati come separatori: il punto (.), lo spazio, il trattino (-), la barra rovesciata (\\) e la barra (/).
NumberPuò contenere cifre, separatori decimali e il simbolo di percentuale (%). I seguenti caratteri possono essere utilizzati come separatori decimali: il punto (.), la virgola (,), il trattino (-), il segno di uguale (=) e lo spazio. I seguenti caratteri possono essere utilizzati come separatori delle migliaia: il punto (.), la virgola (,), l’apostrofo (') e lo spazio.
MoneyContiene sia un valore numerico sia un simbolo di valuta. Il simbolo di valuta può essere posto prima o dopo l’importo.
La lettera minuscola “l” (L), la lettera maiuscola “I” (i) e la cifra “1” possono avere un aspetto simile. Nei field Number o Money, un carattere ambiguo viene riconosciuto come “1”, poiché le lettere non sono consentite.

Impostazioni dell’aspetto

Queste proprietà descrivono l’aspetto dei caratteri previsti nel field.
  • Origine del testo — Indica se il field contiene solo caratteri stampati, solo caratteri scritti a mano o entrambi. Se aggiungi il field trascinando un rettangolo, Vantage deduce questo valore dai caratteri rilevati. Se aggiungi il field con Add Field, il valore predefinito è Printed. Vedi le lingue supportate per il riconoscimento del testo scritto a mano.
  • Elimina lo sfondo del field — Migliora il riconoscimento quando il field ha una cornice, caselle per singoli caratteri o testo segnaposto. Se abiliti questa opzione, carica il documento del modulo vuoto che funge da modello di sfondo ed etichetta il field corrispondente nel modulo vuoto. Il modulo vuoto appare nel Document Set, contrassegnato da un’icona.
  • Font speciali — Migliora l’accuratezza del riconoscimento quando il field utilizza un font specifico. Puoi selezionare più font.
Il riconoscimento del testo scritto a mano è abilitato per impostazione predefinita per le nuove Document skill. Per attivarlo o disattivarlo, fai clic sull’icona delle impostazioni della skill a destra del nome della skill, apri la scheda Lingue e seleziona o deseleziona Scritto a mano nella sezione Aspetto del testo.

Font supportati

FontDescrizioneEsempio di font
FaxUn font tipicamente utilizzato dai fax.Esempio di font Fax
GothicTesti stampati in carattere gotico.Esempio di font Gothic
IndexUn insieme speciale di caratteri che include solo cifre scritte nello stile dei codici postali.Esempio di font Index
Matrix printerTesti stampati con una stampante ad aghi.Esempio di font Matrix printer
MICR CMC-7Uno speciale font Barcode MICR (CMC-7).Esempio di font MICR CMC-7
MICR E-13BCaratteri numerici stampati con inchiostro magnetico. I caratteri MICR (Magnetic Ink Character Recognition) compaiono in vari tipi di documenti, inclusi gli assegni personali.Esempio di font MICR E-13B
OCR-AUn font a spaziatura fissa progettato per il riconoscimento ottico dei caratteri. Ampiamente utilizzato da banche, società emittenti di carte di credito e attività simili.Esempio di font OCR-A
OCR-BUn font progettato per il riconoscimento ottico dei caratteri.Esempio di font OCR-B
ReceiptPer testo di bassa qualità, in genere in un font a spaziatura fissa o normale, usato tipicamente sulle ricevute.Esempio di font Receipt
TypewriterTesti dattiloscritti.Esempio di font Typewriter

Proprietà per tipo di dato

Le proprietà aggiuntive dipendono dal tipo di dato.

Testo

Impostazioni di Value:
  • Lunghezza massima — Il numero massimo di caratteri consentiti. Se il valore estratto supera questa lunghezza, Vantage visualizza un errore. Se il processo include una fase di revisione manuale, il documento passa alla revisione manuale.
  • Espressione regolare — Un pattern che limita l’insieme dei caratteri validi per il field e può migliorare la precisione dell’estrazione. Ad esempio, è possibile forzare il riconoscimento di ogni carattere come cifra, imporre un formato specifico per il numero di telefono oppure convalidare che un field contenga un peso numerico con unità di misura.
Esempio 1 — Numeri di telefono come 1-(234)-567-8900 o 2 (987) 654 3211:
/^(1|2)(\-|\s)\([\d]{3}\)(\-|\s)[\d]{3}(\-|\s)[\d]{4}$/
Esempio 2 — Valori di peso come 50lb, 50lbs, 50Lb, 50Lbs, 50 lb o 50 lbs:
/^[\d]*(\s)?(L|l)b(s)?$/
Le espressioni regolari non influiscono sul riconoscimento del testo nei documenti PDF.

Date

Il valore può includere le seguenti impostazioni:
  • Time — Consente di includere un’ora. Se disabilitato, l’ora non viene estratta.
  • Day of week — Consente di includere un giorno della settimana nel field. Se disabilitato, il giorno della settimana non viene estratto.
  • Month by name — Consente di scrivere il mese in lettere.

Ordine accettabile dei componenti

Seleziona uno o più formati di data: Day-Month-Year, Month-Day-Year o Year-Month-Day. Se il formato rilevato non corrisponde ad alcuno dei formati selezionati, il documento passa alla revisione manuale.

Data accettabile

Specifica un intervallo di date valido come numero di mesi prima e dopo il giorno in cui il documento è stato elaborato. Usa numeri interi. Una regola verifica se la data estratta rientra nell’intervallo; le date al di fuori dell’intervallo passano alla revisione manuale.

Number

Le impostazioni di Value specificano il tipo di numero del valore rilevato (intero o decimale) e quali formati numerici sono accettati nel field. I valori che non soddisfano questi requisiti inviano il documento alla revisione manuale.
  • Solo interi — Il valore deve essere un numero intero. Tutti i Separator nel numero rilevato vengono trattati come separatori delle migliaia.
  • La parte frazionaria può contenere più di due cifre — Attiva questa opzione se è previsto che la parte decimale abbia più di due cifre. Separatori decimali accettati: punto (.), virgola (,), trattino (-), segno di uguale (=), spazio.
  • Può avere valori negativi — Consente valori negativi, indicati da un segno meno o da parentesi.
  • Può includere il simbolo ’%’ — Consente il simbolo di percentuale prima o dopo il valore.

Il numero deve rientrare nell’intervallo

Imposta un valore minimo e uno massimo (interi o decimali, positivi o negativi). Una regola verifica se il valore rientra nell’intervallo; i valori esterni all’intervallo inviano il documento alla revisione manuale.
I field Money utilizzano le stesse proprietà di Number, tranne che il simbolo di percentuale non è consentito.

Etichettatura dei documenti

Linee guida per l’etichettatura di documenti strutturati e semistrutturati durante l’addestramento.

Lingue di riconoscimento supportate

Elenco completo delle lingue OCR supportate negli skill di Vantage.