Imposta regole personalizzate per rilevare ed estrarre field da documenti semi‑strutturati con layout variabili L’attività Regole di estrazione consente di definire regole per rilevare i field nei documenti semi‑strutturati e verificare come tali regole si comportano su documenti reali. È in genere utilizzata quando la posizione di un field può variare da un documento all’altro, rendendo più complessa l’estrazione dei dati, e quando è possibile fornire informazioni aggiuntive per individuare tali field: ad es. la posizione dei field rispetto ad altri oggetti nel documento oppure espressioni regolari che specificano le condizioni di ricerca per un oggetto. Ad esempio, puoi specificare che il field Numero della fattura può trovarsi a destra dell’immagine oppure direttamente sotto le parole “Order number”, “Order #”, o altre parole chiave simili. Si consiglia inoltre di aggiungere un’attività Fast Learning al flusso di elaborazione, abilitando l’Apprendimento online per raccogliere i documenti in fase di esecuzione, che ricostruirà automaticamente la Skill in seguito tramite machine learning.Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
Casi d’uso
- Quando il tuo set di documenti non è sufficientemente omogeneo per utilizzare un’attività Fast Learning per estrarre dati, non hai abbastanza documenti per addestrare un’attività Deep Learning e i documenti hanno una struttura nota che puoi formalizzare.
- Quando desideri un controllo più approfondito sull’IA, analizzando i risultati di previsione delle attività Deep Learning e Fast Learning prima di trasferire quei valori nei field del documento. Ad esempio, se prevedi di estrarre un numero vicino a una parola chiave, puoi filtrare le ipotesi che non sembrano essere un numero e quelle che non si trovano vicino alla parola chiave. In generale, se è richiesto il post-processing con regole, ciò di solito indica che il set di training per le attività Deep Learning e Fast Learning dovrebbe essere ampliato, perché le tecnologie di machine learning possono “intuire” e apprendere il tipo di dato di un field, la posizione tipica e il contesto circostante.
- Quando disponi di un file FlexiLayout da ABBYY FlexiLayout Studio che desideri riutilizzare. Per ulteriori informazioni, vedi Importing FlexiLayouts from ABBYY FlexiLayout Studio.
- Quando i tuoi documenti contengono strutture complesse (ad es. tabelle annidate, cioè strutture ripetute all’interno di altre tabelle) che non possono essere estratte da altre attività pensate per documenti semi‑strutturati.
