Vai al contenuto principale

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

Dopo aver addestrato una Skill di classificazione, apri la scheda Result nello Skill Designer della Skill di classificazione per vedere con quale precisione il classificatore assegna le etichette a ciascuna classe e diagnosticare gli errori nel set di addestramento. Le statistiche vengono aggiornate automaticamente ogni volta che il classificatore viene addestrato. Se la precisione è bassa, vai a Errori di classificazione per scoprire le cause più comuni e come risolverle.
Scheda Result nello Skill Designer della Skill di classificazione, con precisione per classe e numero di documenti.

Prerequisiti

  • Una Skill di classificazione che sia stata addestrata almeno una volta.

Cosa mostra la scheda Result

  • Accuratezza complessiva della classificazione — percentuale di documenti classificati correttamente nell’intero set.
  • Accuratezza per classe — percentuale di documenti classificati correttamente per ogni classe.
  • Numero di documenti per classe — numero di documenti classificati correttamente e in modo errato per ogni classe.
  • Ultimo addestramento — data e ora dell’esecuzione di addestramento più recente.

Tabella dei risultati

La tabella dei risultati contiene tutte le classi utente non vuote (esclusa Nessuna classe). Le classi sono ordinate prima per accuratezza (dalla peggiore alla migliore), poi per numero di documenti e infine in ordine alfabetico per nome. Se non tutte le righe sono visibili sullo schermo, viene visualizzata una barra di scorrimento. Facendo clic su una riga si apre la classe corrispondente nella scheda Documenti. Se si rinomina una classe nella scheda Documenti, il nome nella scheda Result viene aggiornato automaticamente. Se si elimina una classe dopo l’addestramento, il suo nome appare in grigio nella scheda Result; la riga viene rimossa solo al successivo addestramento del classificatore.

Quando interrompere le iterazioni

Non esiste una soglia di accuratezza fissa per una Skill di classificazione: l’obiettivo giusto dipende dal livello di tolleranza agli errori di instradamento dei documenti nei passaggi successivi e da quanta revisione manuale sia accettabile. Come regola pratica, punta a un’accuratezza elevata per ogni singola classe (non solo complessiva), continua a intervenire sulle cause indicate sotto finché il divario si riduce e fermati quando una classe soddisfa il requisito di business oppure si è chiaramente stabilizzata nonostante dati di addestramento puliti e riequilibrati. Se una classe si stabilizza ben al di sotto delle altre, considerala indistinguibile e uniscila a quella più simile. Una volta messa in produzione la skill, continua a monitorare nel tempo l’accuratezza del classificatore di documenti nella Dashboard di analisi e valuta l’Online learning per un miglioramento continuo.

Errori di classificazione

La maggior parte dei casi di classificazione errata è dovuta a errori nel set di addestramento, ad esempio classi di riferimento assegnate in modo errato o un numero insufficiente di documenti per una determinata classe.

Classi di riferimento assegnate erroneamente

Per risolvere il problema, riassegna i documenti interessati e riaddestra il classificatore:
1

Apri la classe interessata nella scheda Documenti

Fai clic su Rivedi previsione nel document set nel riquadro Azioni oppure sulla riga nella tabella dei risultati.
2

Seleziona un documento classificato in modo errato

Seleziona un documento a cui è stata assegnata erroneamente una classe di riferimento.
3

Assegna la classe corretta

Fai clic sul nome della classe corretta nel riquadro Azioni.
4

Ripeti per ogni documento interessato

Ripeti i due passaggi precedenti per ogni documento a cui è stata assegnata erroneamente una classe di riferimento.
5

Riaddestra il classificatore

Fai clic sul pulsante Addestra nel riquadro Azioni.

Dati di addestramento insufficienti o sbilanciati

Una qualità insufficiente del classificatore può essere dovuta ai seguenti fattori:
  • Numero insufficiente di documenti caricati
  • Distribuzione significativamente disomogenea dei documenti tra le classi
  • Numero insufficiente di esempi delle varianti di documento più comuni per la classe in questione
Migliora la qualità del classificatore aggiungendo i documenti mancanti al set di addestramento. Punta ad avere tra 100 e 1.000 documenti per classe e includi documenti di esempio per le varianti di documento più comuni di ciascuna classe in un rapporto approssimativamente uno a uno. Dopo aver aggiunto i nuovi documenti al set di addestramento, assegna una classe a ciascuno e riaddestra il classificatore.

Classi confuse

Se due classi vengono sistematicamente confuse perché non presentano differenze significative nella forma, nel layout o nel testo, uniscile in un’unica classe. Se la distinzione è ancora importante, separa i documenti più avanti nella pipeline usando i valori dei field estratti.
Ad esempio, una classe per le fatture inferiori a 10,000eunaclasseperlefatturesuperioria10,000 e una classe per le fatture superiori a 10,000 verranno probabilmente confuse, poiché l’unica differenza tra loro è il totale dovuto. Uniscile in un’unica classe Invoice e ramifica l’elaborazione in base all’importo nelle fasi successive, dopo aver estratto il totale.

Addestrare un classificatore

Fase precedente — crea un set di addestramento, assegna le classi ed esegui l’addestramento.

Abilitare Online learning

Continua a migliorare la skill anche dopo la messa in produzione.

Dashboard di analisi

Monitora l’accuratezza del classificatore di documenti nel tempo.