Vai al contenuto principale

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

Per creare una skill OCR, segui questi passaggi:
1

Crea una nuova skill OCR

Nel Skill Catalog, fai clic sul pulsante Create nella barra degli strumenti.
2

Seleziona il tipo di skill OCR

Seleziona il tipo di skill skill OCR. Si apre la finestra di dialogo Create OCR Skill.
3

Configura le impostazioni generali

Nella scheda General:
  • Inserisci un nome e una descrizione per la nuova skill.
  • Seleziona la versione di Technology Core. Ti consigliamo di scegliere la versione più recente.
Elaborazione immaginiIn Image Processing, apri il menu a discesa PDF Processing Mode e seleziona la modalità di elaborazione per i documenti PDF:
  • Default (consigliata) — Usa il livello di testo PDF incorporato, se disponibile, e lo integra con l’OCR quando necessario. Questa è l’impostazione predefinita.
  • Use Text Layer Only — Estrae il testo dal livello di testo PDF incorporato. Se non è presente alcun livello di testo, Vantage passa automaticamente all’OCR.
  • Use OCR Only — Ignora qualsiasi livello di testo PDF incorporato ed esegue l’OCR completo sul documento.
Per ulteriori informazioni su ciascuna modalità e suggerimenti su quale scegliere, vedi PDF Processing Mode.
4

Seleziona le lingue di riconoscimento

Nella scheda Languages:
  • Nella sezione Allowed Languages, seleziona una o più lingue per il riconoscimento del documento. Durante l’elaborazione, la lingua del documento verrà scelta automaticamente tra quelle specificate durante la configurazione. Tieni presente che il numero di lingue selezionate può influire sulla velocità e sulla qualità del riconoscimento.
  • Se il documento contiene testo scritto a mano, abilita l’opzione Handwritten nella sezione Text Appearance.
5

Configura i miglioramenti dell'immagine

Nella scheda Image Enhancements, Crop Image e Correct Page Orientation sono attivati per impostazione predefinita. Se necessario, puoi disattivare queste funzionalità se i tuoi documenti non ne richiedono l’uso.
  • Crop Image ritaglia l’immagine in base ai bordi del documento originale.
  • Correct Page Orientation ruota automaticamente l’immagine per ripristinarne l’orientamento originale.
6

Abilita il riconoscimento dei barcode

Nella scheda Barcodes, abilita i tipi di Barcode che possono comparire nei tuoi documenti. Il numero di tipi di Barcode selezionati può influire sulla velocità di riconoscimento. Se non devi riconoscere barcode, fai clic sul pulsante con il numero di opzioni selezionate nell’intestazione della tabella Barcode Types, quindi fai clic su Deselect all.
Se elabori più file di documento con una skill OCR come parte di una singola transaction, tutti i file verranno uniti in uno solo. Di conseguenza, il numero di file di output corrisponderà al numero di formati di esportazione specificati.
7

Scegli i formati di esportazione

Nella scheda Export, seleziona uno o più formati di esportazione del documento.

Formati di esportazione disponibili

  • JSON (formato predefinito):
    • Solo testo (opzione predefinita). Il file JSON esportato conterrà solo il testo riconosciuto senza preservare il layout del documento. Se si seleziona Solo testo, non è possibile esportare in DOCX, XLSX e PPTX.
    • Preserva la struttura del documento. Il file JSON esportato conterrà il testo riconosciuto e verrà preservato anche il layout del documento.
  • XML:
    • Solo testo. Il file XML esportato conterrà solo il testo riconosciuto. Il layout del documento non verrà preservato. Se si seleziona Solo testo, non è possibile esportare in DOCX, XLSX e PPTX.
    • Preserva la struttura del documento. Il file XML esportato conterrà il testo riconosciuto e verrà preservato il layout del documento.
  • ALTOXML:
    • Solo testo. Il file ALTO XML esportato conterrà solo il testo riconosciuto; il layout del documento non verrà preservato. Se si seleziona Solo testo, non è possibile esportare in DOCX, XLSX e PPTX.
    • Preserva la struttura del documento. Il file ALTO XML esportato conterrà il testo riconosciuto e verrà preservato il layout del documento.
Le opzioni di esportazione (Solo testo e Preserva la struttura del documento) per JSON, XML e ALTOXML devono essere le stesse. Se si specifica un’altra opzione di esportazione per uno di questi formati, la stessa verrà applicata anche agli altri.
  • PDF:
    • PDF/A-3a (formato di esportazione PDF predefinito)
    • PDF/A-3b
    • Solo immagine. PDF non modificabile conforme allo standard PDF/A-3b
Per ciascuna opzione di esportazione PDF, scegliere tra “dimensioni del file ridotte” (opzione predefinita) e “massima qualità”. La riduzione delle dimensioni del file è ottenuta tramite la compressione Mixed Raster Content (MRC), che determina tassi di compressione ottimali separatamente per il testo, le immagini e lo sfondo.
  • TXT
  • DOCX (Microsoft Word):
    • Modificabile. Il file DOCX esportato preserva il formato originale e il flusso del testo, consentendo al contempo modifiche agevoli. Il documento di output potrebbe differire dall’immagine originale.
    • Esatto. Il file DOCX esportato mantiene la formattazione del documento originale. Ciò può limitare le modifiche apportabili al testo e alla formattazione del documento di output.
  • XLSX (Microsoft Excel)
  • TIFF
  • JPEG:
    • Qualità massima. Il file esportato contiene un JPEG con un livello di compressione del 95%.
    • Dimensioni ridotte. Il file esportato contiene un JPEG con un livello di compressione del 75%.
  • PPTX (Microsoft PowerPoint)
  • HTML