Un Document skill estrae i valori dei field da documenti strutturati e semi-strutturati di un unico tipo. I documenti dello stesso tipo condividono gli stessi field, le Regole di validazione e la stessa struttura: ad esempio, fatture, contratti ed elenchi di spedizione rappresentano ciascuno un unico tipo di documento.Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
Un Document skill elabora un solo file per transaction. Per elaborare più file in una singola transaction, usa l’attività Extract di un Process skill.
Documenti strutturati e semi-strutturati
| Tipo | Posizione del field | Esempi | Dove creare |
|---|---|---|---|
| Strutturato | Fissa in ogni istanza | Questionari, moduli di richiesta, moduli fiscali | Vantage. Usa Advanced Designer quando devi combinare l’elaborazione di documenti strutturati con altre tecnologie di Vantage. |
| Semi-strutturato | Varia per etichetta, numero e posizione in ogni istanza | Fatture, contratti, distinte di spedizione | Vantage o Advanced Designer. |
Addestramento di una Document skill
Varianti del tipo di documento
Scegliere un’attività in base alla scala
| Varianti nel tuo set di documenti | Approccio consigliato | Accuratezza prevista |
|---|---|---|
| Centinaia | Online learning in Vantage | Estrazione pressoché impeccabile |
| Migliaia | attività Deep Learning | ~80–90%, a seconda della complessità dei documenti |
| Solo le varianti più essenziali | attività Fast Learning e/o Extraction Rules | Accuratezza elevata su documenti complessi |
| Moduli strutturati (fino a 10 varianti) | Vantage Document skill | Elevata. Considera le varianti aggiuntive come tipi di documento separati. |
Le attività Deep Learning, Fast Learning ed Extraction Rules sono disponibili solo in Advanced Designer. Per usarle, apri il tuo Document skill in Advanced Designer: una volta pubblicato, lo skill può comunque essere richiamato da Skill Designer e dai Process skill.
Raccomandazioni per l’addestramento e il test
- Usa un set di addestramento rappresentativo. Includi almeno 2–3 documenti per variante. Anche un solo sample per variante è meglio di nessuno. Quando il set non copre tutte le varianti, usa l’attività Deep Learning: generalizza a partire da pattern di immagine, struttura spaziale, contenuti dei field ed etichette circostanti, e può elaborare varianti su cui non è stata addestrata.
- Esegui i test con distribuzioni simili a quelle di produzione. Usa un sample casuale ricavato dal flusso reale dei tuoi documenti, in modo che ogni variante compaia nel set di test con una frequenza approssimativamente uguale a quella con cui compare in produzione. In questo modo, la stima dell’accuratezza resta valida.
Passaggi successivi
Configurare un Document skill
Crea, addestra e pubblica un Document skill, inclusi moduli strutturati e Online learning.
Aggiungere field
Contrassegna i field nella scheda Editor e configurane le proprietà in base al tipo.
Etichettatura dei documenti
Linee guida per l’etichettatura di documenti strutturati e semi-strutturati durante l’addestramento.
Analizzare i dati estratti
Esamina le statistiche di estrazione dei field e correggi l’etichettatura di riferimento nella scheda Result Review.
