Vai al contenuto principale

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

La scheda Results di Document Skill Designer contiene le statistiche di estrazione dei field per i Document skill. Usa queste statistiche per capire come migliorare la qualità dell’estrazione. Tutti i field estratti dallo skill compaiono nella colonna Fields. I field che appartengono a un gruppo vengono raggruppati in un menu a discesa compresso con il nome del gruppo.
Scheda Results che mostra le statistiche di estrazione per field
Sono disponibili le seguenti statistiche di estrazione dei field:
  • Accuracy — Percentuale di field con valori estratti correttamente, sia per singolo field sia sull’insieme di tutti i field (riga ALL FIELDS). L’accuracy per field viene calcolata come segue:
    Accuracy = Correct / (Correct + Recognition Issue + Located Incorrectly + Not Detected)
    
    La riga ALL FIELDS usa la stessa formula, con ogni termine aggregato su tutti i field.
  • Correct — Numero di istanze di field il cui valore estratto corrisponde al valore di riferimento.
  • Recognition Issue — Numero di istanze di field rilevate nel documento ma non riconosciute correttamente.
  • Located Incorrectly — Numero di istanze di field i cui valori differiscono da quelli previsti perché le relative regioni sono state rilevate in posizioni diverse da quelle definite nell’etichettatura.
  • Not Detected — Numero di istanze di field non rilevate.
  • Frequency in Documents — Percentuale di documenti che contengono il field specificato.
Per impostazione predefinita, le statistiche vengono mostrate per tutti i field. Per filtrare, fai clic sull’icona del filtro nella parte superiore della colonna Fields e seleziona i field che vuoi visualizzare.
Per un’analisi più approfondita della qualità — Precision, Recall e F-measure sia per i valori dei field sia per il rilevamento delle regioni — modifica il tuo skill in Advanced Designer. Per i dettagli, vedi Advanced Accuracy Reports.
Affinché queste statistiche riflettano la qualità in produzione, la distribuzione dei documenti nel set di test deve corrispondere a quella osservata in produzione: per esempio, se il 30% delle fatture in produzione proviene da un determinato fornitore, anche circa il 30% del set di test dovrebbe provenire da quel fornitore. L’uso di un blind set (documenti non utilizzati per l’addestramento o in test precedenti) convalida ulteriormente i risultati.

Revisione dei field estratti con errori

Per visualizzare i documenti che contengono field estratti con errori, fare clic sul valore nella colonna Recognition Issue, Located Incorrectly o Not Detected per il field che si sta esaminando.
Facendo clic sul valore nella colonna Recognition Issue per il field Order Date si apre una scheda che mostra solo i documenti in cui Order Date presenta un problema di riconoscimento.

Modalità di visualizzazione dell’estrazione

La scheda Result Review consente di verificare i risultati dell’estrazione, gli errori di etichettatura e i problemi di riconoscimento, nonché di confrontare l’etichettatura definita in fase di configurazione con il risultato prodotto dall’addestramento. I documenti possono essere visualizzati in tre modalità:
  • Reference — Mostra l’etichettatura di riferimento creata durante la configurazione della skill (prima dell’addestramento) e i valori dei field estratti tramite essa. In questa modalità è possibile modificare i valori dei field e le regioni.
  • Predicted — Mostra i valori dei field e le regioni ottenuti durante l’elaborazione dei documenti. Non modificabile.
  • Difference — Mostra le differenze tra l’etichettatura di riferimento e quella predetta. I valori e le regioni identici sono visualizzati in verde, quelli diversi in rosso. Non modificabile.
Modalità Difference di Document skill con valori identici in verde e valori diversi in rosso
Per passare da una modalità all’altra, fai clic sulla scheda corrispondente nella barra degli strumenti.

Correggere l’etichettatura di riferimento

Se un field è stato etichettato in modo errato durante la configurazione, ma è stato elaborato correttamente durante l’addestramento, puoi aggiornare l’etichettatura di riferimento. Passa alla modalità Difference e fai clic sull’icona sopra il valore del field etichettato in modo errato:
Icona dei problemi di riconoscimento sopra il valore di un field etichettato
La casella Field in Reference mostra il valore estratto in base all’etichettatura di riferimento. Fai clic su Copy from Predicted per sostituire il valore errato con quello estratto durante l’elaborazione.
Un problema di riconoscimento indica che uno o più caratteri non sono stati riconosciuti correttamente. Per risolverlo, regola le proprietà del field in modo che tali caratteri vengano interpretati correttamente. Ad esempio, se un field contiene solo numeri, imposta il relativo tipo di dati su Number. In questo modo eviterai, per esempio, che il numero “1” venga riconosciuto come “l” (elle minuscola) o “I” (i maiuscola).
Se la casella Field in Reference contiene il valore corretto ma il risultato dell’elaborazione è errato, aumenta il numero di documenti nel set e riaddestra la skill. Per passare al documento successivo con lo stesso errore nello stesso field, fai clic su Go to Next Document nel riquadro Actions.

Aggiunta di field

Contrassegna i field nella scheda Editor e configurane le proprietà in base al tipo.

Verifica delle regole

Usa le regole per validare, modificare o calcolare i valori dei field estratti in un Document skill.

Etichettatura dei documenti

Linee guida per etichettare documenti strutturati e semi-strutturati durante l’addestramento.

Addestramento e test di un Document skill

Guida di Advanced Designer per addestrare, testare e misurare la qualità di un Document skill.