Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
Questo articolo è rivolto agli utenti di FlexiCapture che stanno per passare a Vantage. Vantage consente di riutilizzare vari componenti dei progetti FlexiCapture, inclusi i FlexiLayout. Consente inoltre di sfruttare una potente tecnologia di machine learning che è possibile addestrare facilmente sui documenti già etichettati.
Consigliamo innanzitutto di esplorare le skill integrate disponibili in Vantage. Nella maggior parte dei casi, sono almeno altrettanto efficaci dei vostri progetti FlexiCapture. L’efficienza dell’addestramento offerta da Advanced Designer e Vantage potrebbe anche evitare la necessità di riutilizzare i FlexiLayout creati in FlexiLayout Studio.
Sono disponibili oltre 50 skill integrate nello Skill Catalog. Tra le altre, Vantage offre skill per l’elaborazione di fatture, ordini d’acquisto, ricevute e fatture commerciali che possono sostituire con successo ABBYY FlexiCapture for Invoices.
In Vantage, i documenti vengono elaborati in transazioni. A differenza dei batch, alle transazioni non viene assegnato un tipo. Il flusso di elaborazione e le impostazioni di Optical Character Recognition (OCR) per una transazione sono definiti dalla skill che gestisce la transazione.
In generale, sarà necessario sostituire le Document Definitions con Document skill integrate o configurate manualmente, creare una Process skill e configurarne il flusso di elaborazione per instradare i documenti alle Document skill appropriate e ad altre fasi di elaborazione.
Mappatura dei concetti chiave
| Concetto in FlexiCapture | Equivalente in Vantage |
|---|
| Progetto FlexiCapture | Una Process skill che fa riferimento ad altre skill sviluppate in Vantage e in Advanced Designer: Optical Character Recognition (OCR), Skill di classificazione, Document, Document Splitter |
| Batch | Transaction (equivalente parziale) |
| Tipo di batch, proprietà del progetto | Flusso di lavoro di elaborazione dei documenti configurato nella Process skill, impostazioni della skill e impostazioni dell’attività |
| Batch di classificazione | Set di Document di una Skill di classificazione |
| Batch di training | Set di Document nelle Document skill (equivalente parziale) |
| Batch di test | Set di documenti di test in una Document skill in Advanced Designer |
| Document Definition | Document skill |
| Workflow | Flusso di lavoro di elaborazione dei documenti in una Process skill |
| Apprendimento online per l’estrazione dei field | Online Learning per le Document skill |
| Modelli NLP | Attività per documenti non strutturati in una Document skill in Advanced Designer |
Importazione di Documenti
Le Scanning Station di FlexiCapture 12 possono essere completamente sostituite dalle Scanning Station di ABBYY Vantage.
L’importazione da una hot folder (che in Vantage è denominata cartella condivisa) o dalle email può essere configurata nell’attività Input di una Process skill. Il tipo di origine, il nome del file di origine e le informazioni sull’email vengono salvati automaticamente nei Parameter di registrazione.
Puoi anche importare documenti e impostare Parameter di registrazione personalizzati](/vantage/documentation/developer-guide/registration-parameters tramite la Vantage API oppure utilizzare i connettori per importare documenti da una varietà di applicazioni di terze parti.
Configurazione del workflow
Per ricreare il workflow di elaborazione batch, configura una Process skill. In Vantage, le attività della Process skill corrispondono alle fasi di elaborazione. Un set di documenti è una raccolta di documenti all’interno di una transaction.
Mappatura delle fasi del workflow
| Fase del workflow in FlexiCapture | Equivalente in Vantage |
|---|
| Scansione | ABBYY Vantage Scanning Station (non integrata nelle attività della Process skill) |
| Riscansione | Non supportata |
| Riconoscimento | Un workflow che può includere le attività OCR, Classify, Extract e Assemble della Process skill. Le impostazioni OCR possono essere configurate separatamente per ogni Classification e Document skill. Un’attività OCR di una Process skill può essere utilizzata per specificare opzioni generali di pre-riconoscimento per tutti i documenti. Un’attività Classify può essere utilizzata per determinare il tipo di documento e instradare il documento a una Document skill appropriata, associata a un’attività Extract, in cui i dati vengono estratti. Un’attività Assemble può essere utilizzata per assemblare i documenti. |
| Verifica dell’assemblaggio del documento | La verifica dell’integrità di una raccolta di documenti non è supportata. Per assemblare i documenti, è possibile utilizzare l’attività Assemble di una Process skill. |
| Verifica dell’integrità del batch | Le Scanning Station eseguono verifiche automatiche dell’integrità del batch prima che i documenti vengano inviati a Vantage. Un operatore può anche eseguire un controllo manuale sulla Scanning Station. |
| Verifica dei dati, verifica, conferma di esportazione | Attività di revisione manuale di una Process skill. |
| Esportazione | Attività Output o Attività personalizzata di una Process skill. |
| Processed, Exceptions | Stati della Transaction assegnati automaticamente da Vantage. È possibile visualizzare gli stati della Transaction nella sezione Transactions di Skill Monitor. |
| Tipo di utente | Attività Condition o Attività personalizzata di una Process skill. |
I workflow in Vantage richiedono l’interazione con un operatore umano solo se il workflow contiene attività di revisione manuale.
In FlexiCapture 12, la modalità di elaborazione dei PDF si configura a livello di tipo di batch e determina se FlexiCapture utilizza un livello di testo PDF incorporato o esegue l’OCR. ABBYY Vantage offre un controllo equivalente tramite l’impostazione PDF Processing Mode, disponibile negli skill OCR e nelle attività OCR all’interno dei Process skill.
Usa la tabella seguente per associare le impostazioni FlexiCapture esistenti ai corrispondenti equivalenti in Vantage:
| FlexiCapture 12 | Vantage | Note |
|---|
| Auto | Default (consigliato) — corrispondenza parziale | In FlexiCapture, Auto seleziona dinamicamente in base alla qualità del livello di testo. In Vantage, Default utilizza un approccio a combinazione fissa e non è del tutto equivalente. Un vero equivalente di Auto è previsto in una futura release di Vantage. |
| Prefer PDF text layer if available | Use Text Layer Only | Corrispondenza stretta. Entrambi danno priorità al livello di testo incorporato e ricorrono all’OCR quando non è presente alcun livello di testo. |
| Use OCR only | Use OCR Only | Corrispondenza diretta. Entrambi ignorano qualsiasi livello di testo incorporato e forzano l’OCR su tutte le pagine. |
Linee guida per la migrazione: scegliere il punto di partenza
Se non sei sicuro di quale modalità di Vantage utilizzare, le indicazioni seguenti collegano le configurazioni più comuni di FlexiCapture a un punto di partenza consigliato in Vantage:
- Hai usato Auto in FlexiCapture: inizia con Default (consigliato) e monitora i risultati dell’estrazione. Se l’accuratezza è inferiore alle aspettative, passa a Use Text Layer Only (se i tuoi PDF hanno livelli di testo affidabili) oppure a Use OCR Only (se non li hanno).
- Hai usato “Prefer PDF text layer if available” in FlexiCapture: usa Use Text Layer Only in Vantage. Verifica un campione di risultati per confermare che i livelli di testo nei tuoi documenti siano di qualità sufficiente.
- Hai usato “Use OCR only” in FlexiCapture: usa Use OCR Only in Vantage. È l’equivalente diretto.
Un vero equivalente della modalità Auto di FlexiCapture — in cui Vantage valuta dinamicamente la qualità del livello di testo prima di scegliere un metodo di elaborazione — è previsto in una futura release di Vantage. Fino ad allora, Default (consigliato) è l’opzione più simile disponibile per set di documenti misti.
A differenza di FlexiCapture, dove l’impostazione viene configurata una sola volta a livello di tipo di batch, Vantage ti consente di impostare un PDF Processing Mode diverso per ogni skill o attività. Questo ti offre un controllo più granulare durante l’elaborazione di diversi tipi di documento all’interno dello stesso workflow.
Per la documentazione completa dell’impostazione PDF Processing Mode, incluso quando utilizzare ciascuna opzione, consulta PDF Processing Mode.
Vantage consente di creare più attività di revisione manuale in una Process skill. Un operatore di revisione manuale può avere accesso limitato a specifiche fasi di revisione manuale. Per creare utenti e modificare le relative autorizzazioni, vai alla scheda Users in Vantage.
| Ruolo in FlexiCapture | Ruolo in Vantage |
|---|
| Scanning Operator | Skill User |
| Data Verification Operator | Manual Review Operator (con la possibilità di limitare l’accesso a determinate skill e fasi di revisione manuale) |
| Verification Operator | Manual Review Operator (con la possibilità di limitare l’accesso a determinate skill e fasi di revisione manuale) |
| Senior Verification Operator | Processing Supervisor |
| Project Settings Editor | Skill Designer |
| Monitoring Operator | Processing Supervisor (con accesso anche alla revisione manuale) |
| Administrator | Tenant Administrator |
| Web Capture Operator | Skill User + Manual Review Operator |
| Operators Manager | Tenant Administrator (l’unico ruolo che consente di gestire le autorizzazioni utente) |
I modelli di classificazione non possono essere riutilizzati direttamente in Vantage.
Per identificare documenti di tipi diversi, crea una Skill di classificazione. In tale skill puoi caricare i documenti usati per addestrare il modello di classificazione in FlexiCapture, creare classi identiche e addestrare la skill in Vantage. Puoi quindi usare questa skill in un’attività Classify di una Process skill e mappare le classi alle attività Extract. Ogni attività Extract utilizzerà una Document skill che può essere considerata l’equivalente di una sezione Document Definition.
Il clustering è sempre abilitato in Vantage, quindi varianti diverse di documenti dello stesso tipo possono essere identificate automaticamente. Tuttavia, se i layout variano in modo significativo, valuta la creazione di una Document skill in Advanced Designer, aggiungendo un’attività Classify al relativo flusso di lavoro e addestrandola di conseguenza. Puoi configurare un’attività Extraction Rules (che è più o meno l’equivalente di un FlexiLayout) da selezionare automaticamente in base alla variante del documento, inserendo una serie di attività Extraction Rules dopo l’attività Classify.
Per separare i documenti in un flusso di pagine di input, aggiungi un’attività Assemble a una Process skill. Potrebbe anche essere necessario creare e configurare una Document Splitter skill in Advanced Designer.
In generale, sarà necessario sostituire le Definizioni di Document per i diversi tipi di documenti con le relative Document skill. Le Definizioni di Document per varianti diverse di documenti dello stesso tipo devono essere sostituite con attività separate all’interno di un’unica Document skill. Se una Definizione di Document contiene più sezioni, ciascuna sezione deve essere sostituita con un’apposita Document skill.
Le impostazioni di Optical Character Recognition (OCR) e il riconoscimento del testo scritto a mano si configurano nell’ambito di una Document skill. Se si utilizza una Process skill per instradare i documenti verso diverse Document skill, è anche possibile configurare le impostazioni generali di prericonoscimento (lingue, riconoscimento del testo scritto a mano e codici a barre) in un’attività OCR. Si noti che il riconoscimento del testo scritto a mano è abilitato per impostazione predefinita nelle impostazioni della Document skill e disabilitato per impostazione predefinita nell’attività OCR.
Elaborazione del livello di testo PDF: In ABBYY FlexiCapture, era possibile configurare il comportamento del livello di testo PDF rispetto all’OCR come parte di una Definizione di Document. In Vantage, l’impostazione equivalente PDF Processing Mode non viene configurata sulle Document skill — viene configurata nelle skill OCR e nell’attività OCR di una Process skill. Per i dettagli, vedere PDF Processing Mode.
La tecnologia di estrazione dati in Vantage è stata sostanzialmente modificata e migliorata rispetto a FlexiCapture. Il modo in cui funzionano le Extraction Rules e altre attività disponibili in Vantage differisce dagli equivalenti in FlexiCapture, per cui in alcuni casi i risultati possono variare. Assicurarsi di essere soddisfatti dei risultati di estrazione dopo aver sostituito le Definizioni di Document con le Document skill.
Definizioni di Document fisse
Le Definizioni di Document per i moduli non possono essere riutilizzate direttamente in Vantage. Se nessuna delle skill integrate soddisfa le tue esigenze, esporta il batch corrispondente di documenti etichettati da FlexiCapture e importali in una nuova Document skill in Advanced Designer. A questo punto hai due opzioni:
- Aggiungi un’attività Fast Learning al flusso di elaborazione della Document skill e addestrala utilizzando i documenti caricati. Questa attività non richiede un ampio set di documenti per l’addestramento. Per avviare l’addestramento dell’attività usando la tecnologia per i moduli, è sufficiente aggiungere tre documenti che possano essere identificati come istanze dello stesso modulo.
- Aggiungi un’attività Forms al flusso di elaborazione della Document skill e carica un’immagine di un modulo vuoto. Etichetta i field sul modulo vuoto e addestra l’attività. Verifica i risultati sui documenti caricati.
Se non hai bisogno di combinare l’elaborazione di moduli fissi con altre attività, puoi creare in Vantage una semplice Document skill per moduli, senza utilizzare Advanced Designer.
Definizioni di Document basate su descrizioni flessibili
In molti casi, puoi sostituire facilmente una Document Definition esistente con una skill integrata oppure addestrare una nuova skill in Vantage o in Advanced Designer utilizzando i tuoi documenti etichettati. Tuttavia, esiste anche un’opzione rapida per creare in Advanced Designer un equivalente di un FlexiLayout esistente.
Puoi importare un FlexiLayout in una Document skill in Advanced Designer. Puoi creare una nuova Document skill basata sul progetto FlexiLayout oppure importare un FlexiLayout in un’attività Extraction Rules. Le impostazioni della lingua per l’Optical Character Recognition (OCR) vengono ereditate da quelle del FlexiLayout, ma ti consigliamo di verificare le impostazioni OCR della skill dopo l’importazione. I risultati dell’addestramento non possono essere trasferiti in Advanced Designer, ma puoi importare i documenti etichettati da un batch di training e usarli per riaddestrare l’attività in Advanced Designer.
Definizioni dei documenti con tecnologia NLP
I modelli addestrati non possono essere importati in Advanced Designer. Tuttavia, è possibile scegliere uno dei modelli NLP disponibili in Advanced Designer come attività di skill, caricare documenti di esempio e addestrare l’attività. Per addestrare un proprio modello NLP, utilizzare un’attività di Segmentazione e/o Deep Learning in una Document skill in Advanced Designer. Gli script di estrazione non possono essere riutilizzati in Advanced Designer o in Vantage.
Le regole possono essere ricreate sia in Vantage che in Advanced Designer. Le regole di script devono essere riscritte per essere compatibili con l’interprete JavaScript di Vantage.
Assemblaggio del documento
Utilizza un’attività Assemble in una Process skill. Per aggiungere uno script di assemblaggio del documento, crea e configura una skill Document Splitter in Advanced Designer. Lo script deve essere riscritto per essere compatibile con l’interprete JavaScript.
Impostazioni di esportazione
Puoi esportare i risultati dell’elaborazione tramite la Vantage API oppure usare i connettori per esportare i risultati in una varietà di applicazioni di terze parti. L’esportazione in una cartella condivisa può essere configurata nell’attività Output di una Process skill. Usa la stessa attività per configurare i formati di esportazione.
Puoi configurare l’esportazione tramite uno script in un’attività Output o Custom di una Process skill. Lo script deve essere adattato per essere compatibile con l’interprete JavaScript di Vantage. Vantage supporta la memorizzazione delle credenziali per servizi di terze parti in variabili d’ambiente. Queste variabili sono accessibili da questi script.
La struttura dei field viene ricreata automaticamente quando importi documenti etichettati o FlexiLayouts in Advanced Designer. Puoi quindi usare Vantage o Advanced Designer per modificare il layout del modulo dati.
ABBYY FlexiCapture for Invoices
Vantage offre numerose skill integrate per l’elaborazione di vari tipi di documenti, tra cui fatture, ricevute, ordini d’acquisto e fatture commerciali. Funzionano subito e possono sostituire i progetti creati in ABBYY FlexiCapture for Invoices.
Ti consigliamo di testare innanzitutto le skill integrate sui tuoi documenti. Se i risultati di estrazione non ti soddisfano, continua a leggere per consigli su come creare o personalizzare le skill.
I dataset utilizzati nel progetto possono essere caricati nei cataloghi di dati in formato CSV. I cataloghi di dati necessari, con un set di colonne equivalente a quello dei dataset, vengono creati automaticamente per le skill Invoice, Commercial Invoice e Purchase Order.
Se utilizzavi un progetto FlexiCapture for Invoices addestrato sui tuoi documenti, ma senza impostazioni personalizzate manualmente o field personalizzati, non sarà necessario configurare ulteriori impostazioni in Vantage. È sufficiente derivare una skill da quella per fatture integrata desiderata, importare i documenti etichettati e addestrare la skill derivata sul set di documenti risultante.
Se utilizzavi un FlexiLayout personalizzato, ti consigliamo di derivare una skill da quella per fatture integrata desiderata e creare un’attività Extraction Rules importando il FlexiLayout personalizzato. Aggiungi l’attività Extraction Rules creata dopo l’attività Base: <Base Skill Name>. Questo metodo può essere utilizzato, ad esempio, per acquisire field di fattura aggiuntivi.
Se hai più FlexiLayout, puoi aggiungere diverse attività Extraction Rules. Ad esempio, se avevi un FlexiLayout dedicato per ciascun Fornitore, importa ciascun FlexiLayout come attività Extraction Rules e associa i valori del vendor ID (estratti dalla skill base per fatture) alle attività corrispondenti.
I FlexiLayout che utilizzavi in FlexiCapture potevano includere molte impostazioni aggiuntive, come la formattazione della Valuta, le impostazioni locali o le aliquote d’imposta. Queste impostazioni di solito non sono necessarie in Vantage, perché le sue skill integrate includono già tutte le informazioni pertinenti.
Monitoraggio e reportistica
Puoi monitorare la produttività e i dati di elaborazione in Skill Monitor. Le informazioni sugli eventi di elaborazione e sugli errori sono disponibili nelle sezioni Transaction ed Error Log di Skill Monitor. Per generare report sull’elaborazione aziendale, puoi utilizzare il Business Processing Reporting Warehouse incluso in Vantage. Le informazioni sulle attività non legate all’elaborazione delle transaction aziendali sono disponibili nel Security Log.
Elenco delle funzionalità non supportate in Vantage
Le seguenti funzionalità di FlexiCapture non sono supportate in Vantage:
- Controllo degli SLA
- Priorità dei batch
- Riscansione
- Verifica dell’assemblaggio dei documenti
- Allegati utente per le immagini importate
- File di descrizione per i batch da una hot folder
- Verifica doppia
- Verifica distribuita
- Eventi dell’interfaccia di elaborazione
- Impostazioni della skin (puoi solo rimuovere il logo Vantage quando integri il client di revisione manuale nel tuo sistema)
- Script di riconoscimento personalizzato
- Campi di servizio
- Collegamenti a field esistenti (i valori dei field di tutti i documenti in una transaction sono accessibili tramite script)
- Dizionari per le lingue di Optical Character Recognition (OCR)
- Catene di regole (possono essere configurate solo tramite una regola Advanced Script)
- Offuscamento dei dati sensibili durante l’esportazione dei documenti
- Localizzazione del modulo dati, dei nomi delle regole e dei messaggi di script