Vai al contenuto principale

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

Vantage può normalizzare i dati estratti per garantirne una rappresentazione uniforme. È possibile normalizzare i seguenti tipi di dati: Per normalizzare i dati estratti da un field, specificane il tipo di dati:
1

Apri le opzioni del field

Nel modulo dati, fai clic sul pulsante delle impostazioni del field accanto al field.
2

Seleziona un tipo di dati

Nella finestra di dialogo Opzioni del field, seleziona il tipo di dati dall’elenco a discesa.
Affinché la normalizzazione funzioni, imposta per ogni field le proprietà specifiche del tipo di dati, in modo che Vantage estragga tutto ciò che deve essere normalizzato. Fai clic su Avanzate nella finestra di dialogo Opzioni del field per accedere a queste proprietà. Vedi Proprietà per tipo di dati.
Valore normalizzato visualizzato passando il puntatore su un field

Normalizzazione delle date

Durante la normalizzazione delle date, Vantage converte le date estratte nel formato ISO 8601:
  • YYYY-MM-DD per le date
  • HH:MM:SS per l’ora
Per i separatori accettati, vedere Tipi di dati.

Esempi

Dati estrattiDati normalizzati
15.06.20232023-06-15
2023/06/15 22:172023-06-15 22:17:00
06-15-20232023-06-15
02/11/20222022-02-11 oppure 2022-11-02
Saturday, December 3rd, 20222022-12-03
The second of May 20222022-05-02
Se sono abilitati sia i formati Giorno-Mese-Anno sia Mese-Giorno-Anno, Vantage potrebbe non essere in grado di normalizzare la data in modo univoco. In tal caso, puoi scegliere tra le due possibili date.
Le date scritte in lettere vengono normalizzate solo se sono in inglese e se nelle impostazioni della skill è selezionato l’inglese. Vantage potrebbe non essere in grado di normalizzare una data nei seguenti casi:
  • La data è incompleta — ad esempio, 4:39 am (i valori di ora vengono normalizzati solo se estratti insieme a una data).
  • Vengono usati avverbi di tempo invece di date esatte — ad esempio, last month, a few days ago.
  • Accanto alla data o all’ora compaiono parole o caratteri aggiuntivi — ad esempio, 2016/06/15 22.
  • Vengono usate rappresentazioni della data non comuni — ad esempio, 14 Jumada Al-Awwal 1445.

Normalizzare i numeri

Vantage può normalizzare i numeri utilizzando il raggruppamento delle cifre occidentale o indiano:
  • Occidentale — Raggruppa le cifre a tre a tre da destra a sinistra, usando le virgole per separare migliaia, milioni e così via.
  • Indiano — Raggruppa le prime tre cifre da destra, quindi procede a gruppi di due per decine di migliaia, lakh, decine di lakh, crore e così via.
Vantage analizza la stringa estratta e la converte in un formato standardizzato usando un punto (.) per separare la parte intera da quella decimale. Per i separatori accettati, vedere Tipi di dati.

Esempi

Dati estrattiDati normalizzati
12,345,67812345678
-12,345.678-12345.678
12.000012
1.0001000 o 1
12,345.678 %12345.678
1,23,45,67,890 (sistema di numerazione indiano)1234567890
twenty-first21
Se la parte dopo il punto è composta da tre cifre (come in 1.000), occorre scegliere tra i due possibili valori, ossia stabilire se il punto separa le migliaia oppure la parte intera da quella frazionaria.
I numeri scritti in lettere vengono normalizzati solo se sono in inglese e se nelle impostazioni della skill è selezionato l’inglese. Vantage potrebbe non riuscire a normalizzare un numero nei seguenti casi:
  • Accanto al numero compaiono parole o caratteri aggiuntivi, ad esempio EURO12,345.678 o 5 kilos.
  • È presente un numero irregolare di cifre tra la parte intera e quella frazionaria, oppure tra i gruppi di migliaia, ad esempio 123,456,7890. La parte frazionaria deve contenere al massimo 3 cifre. Se viene estratto 123,456,789, il valore normalizzato è 123456789; se viene estratto 123,456,78, il valore normalizzato è 123456.78.
  • Vengono utilizzate rappresentazioni numeriche irregolari.

Normalizzazione degli importi monetari

Un importo monetario contiene un valore numerico e un simbolo di valuta, con il simbolo prima o dopo l’importo. Durante la normalizzazione, Vantage restituisce prima il simbolo di valuta, seguito dall’importo normalizzato come numero. La valuta viene identificata in base al simbolo o al nome: , EURO ed euros corrispondono tutti all’euro. Il valore normalizzato usa il simbolo o il nome esatto trovato nel testo estratto.

Esempi

Dati estrattiDati normalizzati
12,345.678 EUROEURO 12345.678
12,345.678 ¥¥ 12345.678
13,87EE 13.87
13 euro 87euro 13.87
fifty dollarsdollars 50
₹1,23,455₹ 123455
Gli importi scritti in lettere vengono normalizzati solo quando sono in inglese e l’inglese è selezionato nelle impostazioni della skill.
Vantage potrebbe non riuscire a normalizzare un importo monetario quando vengono utilizzate parole non valide per indicare una valuta, ad esempio 12 ttt.

Field di testo

Aggiungi un field di testo, scegli un tipo di dato e configura le proprietà di riconoscimento.

Etichettatura dei documenti

Linee guida per etichettare documenti strutturati e semi-strutturati durante l’addestramento.

Lingue di riconoscimento supportate

Elenco completo delle lingue OCR supportate in tutte le skill di Vantage.