Per creare una skill OCR, segui questi passaggi:Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
Crea una nuova skill OCR
Nel Skill Catalog, fai clic sul pulsante Create nella barra degli strumenti.
Seleziona il tipo di skill OCR
Seleziona il tipo di skill skill OCR. Si apre la finestra di dialogo Create OCR Skill.
Configura le impostazioni generali
Nella scheda General:
- Inserisci un nome e una descrizione per la nuova skill.
- Seleziona la versione di Technology Core. Ti consigliamo di scegliere la versione più recente.
- Default (consigliata) — Usa il livello di testo PDF incorporato, se disponibile, e lo integra con l’OCR quando necessario. Questa è l’impostazione predefinita.
- Use Text Layer Only — Estrae il testo dal livello di testo PDF incorporato. Se non è presente alcun livello di testo, Vantage passa automaticamente all’OCR.
- Use OCR Only — Ignora qualsiasi livello di testo PDF incorporato ed esegue l’OCR completo sul documento.
Per ulteriori informazioni su ciascuna modalità e suggerimenti su quale scegliere, vedi PDF Processing Mode.
Seleziona le lingue di riconoscimento
Nella scheda Languages:
- Nella sezione Allowed Languages, seleziona una o più lingue per il riconoscimento del documento. Durante l’elaborazione, la lingua del documento verrà scelta automaticamente tra quelle specificate durante la configurazione. Tieni presente che il numero di lingue selezionate può influire sulla velocità e sulla qualità del riconoscimento.
- Se il documento contiene testo scritto a mano, abilita l’opzione Handwritten nella sezione Text Appearance.
Configura i miglioramenti dell'immagine
Nella scheda Image Enhancements, Crop Image e Correct Page Orientation sono attivati per impostazione predefinita. Se necessario, puoi disattivare queste funzionalità se i tuoi documenti non ne richiedono l’uso.
- Crop Image ritaglia l’immagine in base ai bordi del documento originale.
- Correct Page Orientation ruota automaticamente l’immagine per ripristinarne l’orientamento originale.
Abilita il riconoscimento dei barcode
Nella scheda Barcodes, abilita i tipi di Barcode che possono comparire nei tuoi documenti. Il numero di tipi di Barcode selezionati può influire sulla velocità di riconoscimento. Se non devi riconoscere barcode, fai clic sul pulsante con il numero di opzioni selezionate nell’intestazione della tabella Barcode Types, quindi fai clic su Deselect all.
Formati di esportazione disponibili
- JSON (formato predefinito):
- Solo testo (opzione predefinita). Il file JSON esportato conterrà solo il testo riconosciuto senza preservare il layout del documento. Se si seleziona Solo testo, non è possibile esportare in DOCX, XLSX e PPTX.
- Preserva la struttura del documento. Il file JSON esportato conterrà il testo riconosciuto e verrà preservato anche il layout del documento.
- XML:
- Solo testo. Il file XML esportato conterrà solo il testo riconosciuto. Il layout del documento non verrà preservato. Se si seleziona Solo testo, non è possibile esportare in DOCX, XLSX e PPTX.
- Preserva la struttura del documento. Il file XML esportato conterrà il testo riconosciuto e verrà preservato il layout del documento.
- ALTOXML:
- Solo testo. Il file ALTO XML esportato conterrà solo il testo riconosciuto; il layout del documento non verrà preservato. Se si seleziona Solo testo, non è possibile esportare in DOCX, XLSX e PPTX.
- Preserva la struttura del documento. Il file ALTO XML esportato conterrà il testo riconosciuto e verrà preservato il layout del documento.
- PDF:
- PDF/A-3a (formato di esportazione PDF predefinito)
- PDF/A-3b
- Solo immagine. PDF non modificabile conforme allo standard PDF/A-3b
- TXT
- DOCX (Microsoft Word):
- Modificabile. Il file DOCX esportato preserva il formato originale e il flusso del testo, consentendo al contempo modifiche agevoli. Il documento di output potrebbe differire dall’immagine originale.
- Esatto. Il file DOCX esportato mantiene la formattazione del documento originale. Ciò può limitare le modifiche apportabili al testo e alla formattazione del documento di output.
- XLSX (Microsoft Excel)
- TIFF
- JPEG:
- Qualità massima. Il file esportato contiene un JPEG con un livello di compressione del 95%.
- Dimensioni ridotte. Il file esportato contiene un JPEG con un livello di compressione del 75%.
- PPTX (Microsoft PowerPoint)
- HTML
