Esamina l’accuratezza della classificazione per classe nella scheda Result e correggi i problemi più comuni del set di addestramento che causano errori di classificazione.
Use this file to discover all available pages before exploring further.
Dopo aver addestrato una Skill di classificazione, apri la scheda Result nello Skill Designer della Skill di classificazione per vedere con quale precisione il classificatore assegna le etichette a ciascuna classe e diagnosticare gli errori nel set di addestramento. Le statistiche vengono aggiornate automaticamente ogni volta che il classificatore viene addestrato. Se la precisione è bassa, vai a Errori di classificazione per scoprire le cause più comuni e come risolverle.
La tabella dei risultati contiene tutte le classi utente non vuote (esclusa Nessuna classe). Le classi sono ordinate prima per accuratezza (dalla peggiore alla migliore), poi per numero di documenti e infine in ordine alfabetico per nome. Se non tutte le righe sono visibili sullo schermo, viene visualizzata una barra di scorrimento.Facendo clic su una riga si apre la classe corrispondente nella scheda Documenti. Se si rinomina una classe nella scheda Documenti, il nome nella scheda Result viene aggiornato automaticamente. Se si elimina una classe dopo l’addestramento, il suo nome appare in grigio nella scheda Result; la riga viene rimossa solo al successivo addestramento del classificatore.
Non esiste una soglia di accuratezza fissa per una Skill di classificazione: l’obiettivo giusto dipende dal livello di tolleranza agli errori di instradamento dei documenti nei passaggi successivi e da quanta revisione manuale sia accettabile. Come regola pratica, punta a un’accuratezza elevata per ogni singola classe (non solo complessiva), continua a intervenire sulle cause indicate sotto finché il divario si riduce e fermati quando una classe soddisfa il requisito di business oppure si è chiaramente stabilizzata nonostante dati di addestramento puliti e riequilibrati. Se una classe si stabilizza ben al di sotto delle altre, considerala indistinguibile e uniscila a quella più simile.Una volta messa in produzione la skill, continua a monitorare nel tempo l’accuratezza del classificatore di documenti nella Dashboard di analisi e valuta l’Online learning per un miglioramento continuo.
La maggior parte dei casi di classificazione errata è dovuta a errori nel set di addestramento, ad esempio classi di riferimento assegnate in modo errato o un numero insufficiente di documenti per una determinata classe.
Una qualità insufficiente del classificatore può essere dovuta ai seguenti fattori:
Numero insufficiente di documenti caricati
Distribuzione significativamente disomogenea dei documenti tra le classi
Numero insufficiente di esempi delle varianti di documento più comuni per la classe in questione
Migliora la qualità del classificatore aggiungendo i documenti mancanti al set di addestramento. Punta ad avere tra 100 e 1.000 documenti per classe e includi documenti di esempio per le varianti di documento più comuni di ciascuna classe in un rapporto approssimativamente uno a uno.Dopo aver aggiunto i nuovi documenti al set di addestramento, assegna una classe a ciascuno e riaddestra il classificatore.
Se due classi vengono sistematicamente confuse perché non presentano differenze significative nella forma, nel layout o nel testo, uniscile in un’unica classe. Se la distinzione è ancora importante, separa i documenti più avanti nella pipeline usando i valori dei field estratti.
Ad esempio, una classe per le fatture inferiori a 10,000eunaclasseperlefatturesuperioria10,000 verranno probabilmente confuse, poiché l’unica differenza tra loro è il totale dovuto. Uniscile in un’unica
classe Invoice e ramifica l’elaborazione in base all’importo nelle fasi successive, dopo aver estratto il totale.