Vai al contenuto principale

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

Per addestrare un classificatore, ti servirà un set di addestramento che contenga documenti a cui è già stata assegnata una classe di riferimento (la classe che hai definito come riferimento per l’addestramento).

Prerequisiti

Creare un set di addestramento

1

Aprire la scheda documents

Nel Skill Designer di classificazione, aprire la scheda documents.
2

Creare le classi appropriate

Creare le classi appropriate utilizzando il comando Create Class nel Riquadro azioni oppure facendo clic su Create class sopra l’elenco delle classi nella parte sinistra dello schermo.
Per rinominare una classe esistente, fare clic sull’icona accanto al nome della classe e selezionare Rename class.
3

Caricare documenti in ogni classe

Selezionare una classe dall’elenco delle classi nella parte sinistra dello schermo e caricare i documenti con una delle seguenti opzioni:
  • Upload documents al centro della schermata Skill di classificazione
  • Il pulsante Upload nella barra degli strumenti
  • Upload documents nel Riquadro azioni
Durante il caricamento dei documenti, un indicatore di avanzamento viene visualizzato nella parte superiore dello Skill Designer, a destra dei segnalibri. Il tooltip dell’indicatore contiene informazioni sul numero di documenti che devono ancora essere caricati ed elaborati.I documenti caricati nel gruppo No class non vengono utilizzati per l’addestramento e il test del classificatore. Se il caricamento di un file non riesce, ad esempio perché è in un formato non supportato, il suo nome viene visualizzato in rosso.

Dimensione del set di addestramento

Per ogni classe viene visualizzato il numero di documenti presenti in quella classe. Tieni presenti le seguenti indicazioni:
  • Se il tuo set di documenti contiene pochissime classi, oppure se le classi differiscono notevolmente tra loro, può bastare un numero ridotto di documenti per classe.
  • Se hai molte classi, oppure se le differenze tra le classi sono lievi, carica da 10 a 100 documenti per ogni classe. In questo caso, un numero inferiore di documenti può causare errori di classificazione.
  • Non caricare più di 1.000 documenti per una singola classe.
  • Per massimizzare l’accuratezza, includi un documento di esempio per ogni variante comune di ciascuna classe.

Visualizzare i documenti e l’anteprima

Per impostazione predefinita, i documenti caricati vengono visualizzati in un elenco, facile da consultare se i file hanno nomi descrittivi. È anche possibile passare alla vista in miniatura, che può risultare preferibile per documenti visivamente distinti. Utilizzare i pulsanti della barra degli strumenti per passare da Vista elenco a Vista miniature. Se vengono caricati più di 50 documenti, questi vengono distribuiti su più pagine. Per visualizzare l’anteprima di un documento, fare clic sul pulsante a sinistra del nome. Trascinare il bordo sinistro della finestra di anteprima per ridimensionarla.

Ruotare le pagine del documento

Per ruotare le pagine del documento:
  • Fare clic su Ruota nella barra degli strumenti per ruotare di 90° in senso antiorario.
  • Oppure selezionare Ruota a sinistra, Ruota a destra o Ruota di 180° dall’elenco a discesa.
  • È inoltre possibile ruotare un singolo documento dalla relativa finestra di anteprima.

Cambiare la classe assegnata a un documento

  1. Contrassegna uno o più documenti selezionando la casella di controllo a sinistra dei rispettivi nomi.
  2. Nel Riquadro azioni, seleziona la classe appropriata e fai clic su Assegna. Se la classe corretta non è presente nell’elenco, inserisci un nuovo nome nel field Cerca classe e fai clic su Crea.

Rimuovere i documenti dal set

Puoi rimuovere i documenti in uno dei seguenti modi:
  • Contrassegna uno o più documenti selezionando la casella di controllo a sinistra dei rispettivi nomi. Puoi contrassegnare tutti i documenti di una classe specifica selezionando la casella di controllo accanto al nome della classe sopra l’elenco dei documenti (se la classe occupa più pagine, vengono contrassegnati solo i documenti presenti nella pagina corrente). Fai clic sull’icona accanto a uno dei documenti contrassegnati e quindi su Elimina. Conferma la scelta nella finestra di dialogo.
  • Fai clic sull’icona accanto al nome di una classe nell’elenco delle classi e quindi su Elimina tutti i documenti. Conferma la scelta. Questa operazione elimina tutti i documenti della classe selezionata. In alternativa, fai clic su Elimina la classe con tutti i documenti per eliminare anche la classe stessa insieme ai relativi documenti.
Puoi eliminare un singolo documento senza contrassegnarlo prima: fai clic sull’icona accanto al suo nome.

Addestra il classificatore

Il set di addestramento deve contenere almeno due classi diverse e non vuote. Finché questa condizione non è soddisfatta, il pulsante Addestra rimane disabilitato.
Per addestrare un classificatore utilizzando un set di addestramento preparato, fai clic sul pulsante Addestra nel Riquadro azioni. Una volta completato l’addestramento, l’icona Completato viene visualizzata accanto al pulsante Addestra. Anche l’elenco delle classi nella scheda documents si aggiorna: oltre al numero di documenti caricati per classe, mostra il numero di documenti la cui classe prevista è diversa dalla classe di riferimento.
Elenco delle classi dopo l'addestramento, con il numero di documenti per classe e le previsioni errate.
Per interrompere l’addestramento, fai clic su Annulla sotto il pulsante Addestra nel Riquadro azioni.

Risoluzione dei problemi

Se il classificatore addestrato produce risultati scadenti, apri la scheda Result e controlla l’accuratezza per classe. Ecco le cause più comuni e come risolverle:
  • Classi di riferimento assegnate in modo errato. Riassegna i documenti interessati alla classe corretta e ripeti l’addestramento.
  • Documenti di addestramento insufficienti o distribuiti in modo non uniforme tra le classi. Aggiungi altri esempi: l’obiettivo è 100–1.000 per classe, con circa un documento per ogni variante comune.
  • Classi troppo simili che non si differenziano abbastanza nei rispettivi parametri. Uniscile in un’unica classe e, se necessario, separa i documenti in una fase successiva della pipeline in base ai dati estratti.
Per la procedura completa, vedi Analizzare i risultati della classificazione.

Analizza i risultati della classificazione

Esamina l’accuratezza per classe nella scheda Result e correggi gli errori comuni nel set di addestramento.

Procedura dettagliata del Supporto ABBYY

Articolo del Supporto ABBYY con una procedura dettagliata sulla creazione e l’addestramento di una Skill di classificazione in Vantage.