Vai al contenuto principale

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

Ecco lo schema JSON OCR utilizzato quando esporti dati estratti come i valori dei field, la struttura dei field e gli errori di verifica delle regole.
"$schema": "http://json-schema.org/draft-07/schema",
  "type": "object",
  "description": "Document.",
  "definitions": {
    "borderType": {
      "type": "string",
      "description": "Tipo di bordo della cella di tabella.",
      "enum": [
        "unknown",
        "invisible",
        "visible"
      ]
    },
    "rect": {
      "type": "object",
      "description": "Rectangle {r:left, t:top, r:right, b:bottom}",
      "required": [
        "l",
        "t",
        "r",
        "b"
      ],
      "properties": {
        "l": {
          "type": "integer",
          "description": "Coordinata sinistra."
        },
        "t": {
          "type": "integer",
          "description": "Coordinata superiore."
        },
        "r": {
          "type": "integer",
          "description": "Coordinata destra."
        },
        "b": {
          "type": "integer",
          "description": "Coordinata inferiore."
        }
      }
    },
    "confidence": {
      "type": "number",
      "description": "Affidabilità."
    },
    "listNumberingStyle": {
      "type": "string",
      "description": "Stile di numerazione dell'elenco.",
      "enum": [
        "None",
        "Decimal",
        "UpperRoman",
        "LowerRoman",
        "UpperLetter",
        "LowerLetter",
        "Ordinal",
        "CardinalText",
        "OrdinalText",
        "Hex",
        "Chicago",
        "IdeographDigital",
        "JapaneseCounting",
        "Aiueo",
        "Iroha",
        "DecimalFullWidth",
        "DecimalHalfWidth",
        "JapaneseLegal",
        "JapaneseDigitalTenThousand",
        "DecimalEnclosedCircle",
        "DecimalFullWidth2",
        "AiueoFullWidth",
        "IrohaFullWidth",
        "DecimalZero",
        "Bullet",
        "Ganada",
        "Chosung",
        "DecimalEnclosedFullstop",
        "DecimalEnclosedParen",
        "DecimalEnclosedCircleChinese",
        "IdeographEnclosedCircle",
        "IdeographTraditional",
        "IdeographZodiac",
        "IdeographZodiacTraditional",
        "TaiwaneseCounting",
        "IdeographLegalTraditional",
        "TaiwaneseCountingThousand",
        "TaiwaneseDigital",
        "ChineseCounting",
        "ChineseLegalSimplified",
        "ChineseCountingThousand",
        "ApplicationDefined",
        "KoreanDigital",
        "KoreanCounting",
        "KoreanLegal",
        "KoreanDigital2",
        "Hebrew1",
        "ArabicAlpha",
        "Hebrew2",
        "ArabicAbjad",
        "HindiVowels",
        "HindiConsonants",
        "HindiNumbers",
        "HindiCounting",
        "ThaiLetters",
        "ThaiNumbers",
        "ThaiCounting",
        "VietnameseCounting",
        "NumberInDash",
        "RussianLower",
        "RussianUpper",
        "Burmese",
        "Unnumbered"
      ]
    },
    "listLevel": {
      "type": "object",
      "description": "Descrizione del livello di elenco",
      "required": [
        "levelIndex",
        "numberingStyle",
        "startNumber"
      ],
      "properties": {
        "levelIndex": {
          "type": "integer",
          "description": "Indice del livello.",
          "minimum": 0
        },
        "numberingStyle": {
          "$ref": "#/definitions/listNumberingStyle",
          "description": "Stile di numerazione dell'elenco."
        },
        "startNumber": {
          "type": "integer",
          "description": "Numero iniziale."
        }
      }
    },
    "picture": {
      "type": "object",
      "description": "Blocco con immagine.",
      "properties": {
        "id": {
          "type": "string",
          "description": "ID del blocco immagine."
        },
        "position": {
          "$ref": "#/definitions/rect"
        },
        "confidence": {
          "$ref": "#/definitions/confidence"
        }
      }
    },
    "barcode": {
      "type": "object",
      "description": "Codice a barre.",
      "properties": {
        "id": {
          "type": "string",
          "description": "ID del blocco codice a barre."
        },
        "position": {
          "$ref": "#/definitions/rect"
        },
        "confidence": {
          "$ref": "#/definitions/confidence"
        },
        "type": {
          "type": "string",
          "description": "Tipo di codice a barre.",
          "enum": [
            "Code39",
            "Interleaved25",
            "EAN13",
            "Code128",
            "EAN8",
            "PDF417",
            "Codabar",
            "UPCE",
            "Industrial25",
            "IATA25",
            "Matrix25",
            "Code93",
            "PostNet",
            "UCC128",
            "Patch",
            "Aztec",
            "DataMatrix",
            "QRCode",
            "UPCA",
            "MaxiCode",
            "Code32",
            "FullAscii",
            "IntelligentMail",
            "RoyalMail4State",
            "KIX",
            "Australia4State",
            "JapanPost",
            "NotFound"
          ]
        },
        "value": {
          "type": "string",
          "description": "Valore del codice a barre."
        },
        "supplementType": {
          "type": "string",
          "description": "Tipo di supplemento.",
          "enum": [
            "none",
            "2digits",
            "5digits"
          ]
        },
        "supplementValue": {
          "type": "string",
          "description": "Valore del supplemento."
        }
      }
    },
    "lines": {
      "type": "array",
      "description": "Array di stringhe di testo nel blocco di testo ordinate per direzione di lettura.",
      "items": [
        {
          "type": "object",
          "description": "Riga di testo.",
          "properties": {
            "position": {
              "$ref": "#/definitions/rect"
            },
            "confidence": {
              "$ref": "#/definitions/confidence"
            },
            "text": {
              "type": "string",
              "description": "Valore della riga di testo."
            },
            "charParams": {
              "$ref": "#/definitions/charParams"
            },
            "words": {
              "type": "array",
              "description": "Array di parole in una riga di testo ordinate per direzione di lettura.",
              "items": [
                {
                  "type": "object",
                  "description": "Parola.",
                  "properties": {
                    "position": {
                      "$ref": "#/definitions/rect"
                    },
                    "confidence": {
                      "$ref": "#/definitions/confidence"
                    },
                    "text": {
                      "type": "string",
                      "description": "Valore della parola."
                    },
                    "charParams": {
                      "$ref": "#/definitions/charParams"
                    },
                    "chars": {
                      "type": "array",
                      "description": "Array di caratteri in una parola ordinati per direzione di lettura.",
                      "items": [
                        {
                          "type": "object",
                          "description": "Carattere della parola.",
                          "properties": {
                            "confidence": {
                              "$ref": "#/definitions/confidence"
                            },
                            "text": {
                              "type": "string",
                              "description": "Valore del carattere della parola."
                            },
                            "position": {
                              "$ref": "#/definitions/rect"
                            },
                            "charParams": {
                              "$ref": "#/definitions/charParams"
                            }
                          }
                        }
                      ]
                    }
                  }
                }
              ]
            }
          }
        }
      ]
    },
    "charParams": {
      "type": "object",
      "description": "Parametri di formattazione del font del simbolo.",
      "properties": {
        "bold": {
          "type": "boolean",
          "description": "Stato della proprietà grassetto - se diverso da quello del contenitore",
          "default": false
        },
        "italic": {
          "type": "boolean",
          "description": "Stato della proprietà corsivo - se diverso da quello del contenitore",
          "default": false
        },
        "underlined": {
          "type": "boolean",
          "description": "Stato della proprietà sottolineato - se diverso da quello del contenitore",
          "default": false
        },
        "strikeout": {
          "type": "boolean",
          "description": "Stato della proprietà barrato - se diverso da quello del contenitore",
          "default": false
        },
        "smallCaps": {
          "type": "boolean",
          "description": "Stato della proprietà maiuscoletto - se diverso da quello del contenitore",
          "default": false
        },
        "superscript": {
          "type": "boolean",
          "description": "Stato della proprietà apice - se diverso da quello del contenitore",
          "default": false
        },
        "subscript": {
          "type": "boolean",
          "description": "Stato della proprietà pedice - se diverso da quello del contenitore",
          "default": false
        },
        "scaling": {
          "type": "integer",
          "description": "Stato della proprietà di scala (in millesimi di 1) - se diverso da quello del contenitore",
          "default": 1000,
          "minimum": 100,
          "maximum": 10000
        },
        "spacing": {
          "type": "integer",
          "description": "Stato della proprietà di spaziatura in twip (1/20 pt, 1/1440 pollici) - se diverso da quello del contenitore",
          "default": 0,
          "minimum": -1000,
          "maximum": 1000
        },
        "fontSize": {
          "type": "integer",
          "description": "Stato della proprietà dimensione del carattere in twip (1/20 pt, 1/1440 pollici) - se diverso da quello del contenitore",
          "default": 200,
          "minimum": 50,
          "maximum": 4000
        },
        "fontName": {
          "type": "string",
          "description": "Stato della proprietà nome del carattere - se diverso da quello del contenitore"
        },
        "color": {
          "type": "string",
          "description": "Stato della proprietà colore del carattere del simbolo (valore esadecimale in formato a 6 cifre RRGGBB) - se diverso da quello del contenitore"
        },
        "backgroundColor": {
          "type": "string",
          "description": "Stato della proprietà colore di sfondo del simbolo (valore esadecimale in formato a 6 cifre RRGGBB) - se diverso da quello del contenitore"
        },
        "lang": {
          "type": "string",
          "description": "Stato della proprietà lingua del simbolo (composto da parti di lingua e paese, fare riferimento a ISO 639 e ISO 3166) - se diverso da quello del contenitore"
        }
      }
    }
  },
  "required": [
    "version",
    "producer"
  ],
  "properties": {
    "version": {
      "type": "string",
      "description": "Versione dello schema del documento.",
      "default": "Vantage OCR.Skill JSON output v1.0"
    },
    "producer": {
      "type": "string",
      "description": "Autore del file JSON.",
      "default": "ABBYY Vantage OCR.Skill"
    },
    "languages": {
      "type": "array",
      "description": "Elenco delle lingue del documento.",
      "items": [
        {
          "type": "string",
          "description": "Lingua del documento."
        }
      ]
    },
    "layout": {
      "type": "object",
      "description": "Layout (struttura fisica).",
      "required": [
        "pages"
      ],
      "properties": {
        "corrected": {
          "type": "boolean",
          "description": "Coordinate per l'immagine corretta nell'output.",
          "default": true
        },
        "pages": {
          "type": "array",
          "description": "Array delle pagine del documento ordinate dalla prima all'ultima.",
          "items": [
            {
              "type": "object",
              "description": "Pagina del documento.",
              "properties": {
                "width": {
                  "type": "integer",
                  "description": "Larghezza della pagina in pixel."
                },
                "height": {
                  "type": "integer",
                  "description": "Altezza della pagina in punti."
                },
                "rotated": {
                  "type": "string",
                  "description": "Rotazione della pagina rispetto all'immagine originale.",
                  "enum": [
                    "none",
                    "clockwise",
                    "counterclockwise",
                    "upside-down"
                  ]
                },
                "texts": {
                  "type": "array",
                  "description": "Array di blocchi con testo.",
                  "items": [
                    {
                      "type": "object",
                      "description": "Testo.",
                      "properties": {
                        "id" : {
                          "type": "string",
                          "description": "ID del blocco di testo."
                        },
                        "position": {
                          "$ref": "#/definitions/rect"
                        },
                        "confidence": {
                          "$ref": "#/definitions/confidence"
                        },
                        "lines": {
                          "#ref": "#/definitions/lines"
                        }
                      }
                    }
                  ]
                },
                "tables": {
                  "type": "array",
                  "description": "Array di blocchi con tabella.",
                  "items": [
                    {
                      "type": "object",
                      "description": "Tabella.",
                      "properties": {
                        "id" : {
                          "type": "string",
                          "description": "ID del blocco tabella."
                        },
                        "position": {
                          "$ref": "#/definitions/rect"
                        },
                        "confidence": {
                          "$ref": "#/definitions/confidence"
                        },
                        "cells": {
                          "type": "array",
                          "description": "Celle della tabella.",
                          "items": [
                            {
                              "type": "object",
                              "description": "Cella della tabella.",
                              "properties": {
                                "id" : {
                                  "type": "string",
                                  "description": "ID della cella della tabella."
                                },
                                "position": {
                                  "$ref": "#/definitions/rect"
                                },
                                "confidence": {
                                  "$ref": "#/definitions/confidence"
                                },
                                "colRowPosition": {
                                  "type": "object",
                                  "description": "Coordinata della cella nel sistema Colonna-Riga {l:colonnaSinistra, t:rigaSuperiore, r:colonnaDestra, b:rigaInferiore}",
                                  "properties":{
                                    "l": {
                                      "type": "integer",
                                      "description": "Indice del separatore sinistro."
                                    },
                                    "t": {
                                      "type": "integer",
                                      "description": "Indice del separatore superiore."
                                    },
                                    "r": {
                                      "type": "integer",
                                      "description": "Indice del separatore destro."
                                    },
                                    "b": {
                                      "type": "integer",
                                      "description": "Indice del separatore inferiore."
                                    }
                                  }
                                },
                                "borders": {
                                  "type": "object",
                                  "description": "Tipi di bordo della cella della tabella {l:sinistro, t:superiore, r:destro, b:inferiore}",
                                  "properties":{
                                    "l": {
                                      "$ref": "#/definitions/borderType",
                                      "description": "Tipo di bordo sinistro."
                                    },
                                    "t": {
                                      "$ref": "#/definitions/borderType",
                                      "description": "Tipo di bordo superiore."
                                    },
                                    "r": {
                                      "$ref": "#/definitions/borderType",
                                      "description": "Tipo di bordo destro."
                                    },
                                    "b": {
                                      "$ref": "#/definitions/borderType",
                                      "description": "Tipo di bordo inferiore."
                                    }
                                  }
                                },
                                "contentType": {
                                  "type": "string",
                                  "description": "Tipo di contenuto della cella della tabella: [text, picture, barcode].",
                                  "enum": [
                                    "text",
                                    "picture",
                                    "barcode"
                                  ]
                                },
                                "picture": {
                                  "$ref": "#/definitions/picture"
                                },
                                "barcode": {
                                  "$ref": "#/definitions/barcode"
                                },
                                "lines": {
                                  "$ref": "#/definitions/lines"
                                }
                              }
                            }
                          ]
                        }
                      }
                    }
                  ]
                },
                "pictures": {
                  "type": "array",
                  "description": "Array di blocchi con immagine.",
                  "items": [
                    {
                      "$ref": "#/definitions/picture"
                    }
                  ]
                },
                "barcodes": {
                  "type": "array",
                  "description": "Array di blocchi con codice a barre.",
                  "items": [
                    {
                      "$ref": "#/definitions/barcode"
                    }
                  ]
                },
                "separators": {
                  "type": "array",
                  "description": "Array di blocchi con separatore.",
                  "items": [
                    {
                      "type": "object",
                      "description": "Separatore.",
                      "properties": {
                        "position": {
                          "$ref": "#/definitions/rect"
                        },
                        "confidence": {
                          "$ref": "#/definitions/confidence"
                        },
                        "color": {
                          "type": "integer",
                          "description": "Colore del separatore."
                        },
                        "thickness": {
                          "type": "integer",
                          "description": "Spessore del separatore."
                        },
                        "type": {
                          "type": "string",
                          "description": "Tipo di separatore.",
                          "enum": [
                            "unknown",
                            "solid",
                            "dotted"
                          ]
                        },
                        "endPoints": {
                          "type": "object",
                          "description": "Coordinate delle estremità del separatore {startX:startX, startY:startY, endX:endX, endY:endY}",
                          "properties":{
                            "startX": {
                              "type": "integer",
                              "description": "Coordinata X del punto iniziale."
                            },
                            "startY": {
                              "type": "integer",
                              "description": "Coordinata Y del punto iniziale."
                            },
                            "endX": {
                              "type": "integer",
                              "description": "Coordinata X del punto finale."
                            },
                            "endY": {
                              "type": "integer",
                              "description": "Coordinata Y del punto finale."
                            }
                          }
                        }
                      }
                    }
                  ]
                },
                "checkmarks": {
                  "type": "array",
                  "description": "Array di blocchi con casella di controllo.",
                  "items": [
                    {
                      "type": "object",
                      "description": "Casella di controllo.",
                      "properties": {
                        "position": {
                          "$ref": "#/definitions/rect"
                        },
                        "confidence": {
                          "$ref": "#/definitions/confidence"
                        },
                        "value": {
                          "type": "string",
                          "description": "Valore della casella di controllo.",
                          "enum": [
                            "checked",
                            "unchecked",
                            "corrected",
                            "unknown"
                          ]
                        }
                      }
                    }
                  ]
                }
              }
            }
          ]
        }
      }
    },
    "content": {
      "type": "object",
      "description": "Contenuto del documento (struttura logica).",
      "properties": {
        "paragraphs": {
          "type": "array",
          "description": "Array di paragrafi del documento ordinati per direzione di lettura.",
          "items": [
            {
              "type": "object",
              "description": "Paragrafo del documento.",
              "properties": {
                "id": {
                  "type": "string",
                  "description": "ID del paragrafo nel documento."
                },
                "role": {
                  "type": "string",
                  "description": "Ruolo del paragrafo nel documento.",
                  "enum": [
                    "other",
                    "text",
                    "heading",
                    "headingNumber",
                    "tableOfContents",
                    "tableText",
                    "runningTitle",
                    "endNote",
                    "footNote",
                    "tableCaption",
                    "tableHeading",
                    "pictureCaption",
                    "artefact"
                  ]
                },
                "formatting": {
                  "type": "object",
                  "description": "Formattazione del paragrafo.",
                  "properties": {
                    "aligning": {
                      "type": "string",
                      "description": "Allineamento del testo nel paragrafo.",
                      "enum": [
                        "left",
                        "center",
                        "right",
                        "justified",
                        "justifiedForArabic"
                      ]
                    },
                    "lineSpacing": {
                      "type": "integer",
                      "description": "Interlinea del paragrafo.",
                      "minimum": 0,
                      "default": 0
                    }
                  }
                },
                "layoutReferences": {
                  "type": "array",
                  "description": "Array delle origini delle parti del paragrafo del documento nella struttura dei blocchi della pagina, nell'ordine del testo nel paragrafo.",
                  "items": [
                    {
                      "type": "object",
                      "description": "ID del blocco/cella di riferimento, indice del paragrafo e intervallo di righe nel blocco/cella.",
                      "required": [
                        "blockId",
                        "blockType",
                        "parIndex",
                        "firstLine",
                        "lastLine"
                      ],
                      "properties": {
                        "blockId": {
                          "type": "string",
                          "description": "ID del blocco di testo o della cella di tabella contenitore."
                        },
                        "blockType": {
                          "type": "string",
                          "description": "Tipo di contenitore del paragrafo.",
                          "enum": [
                            "text",
                            "cell"
                          ]
                        },
                        "sectionIndex": {
                          "type": "integer",
                          "description": "Indice della sezione logica nella pagina (o -1 se non esiste una sezione contenente il paragrafo, come intestazioni, piè di pagina, ecc.).",
                          "minimum": -1
                        },
                        "columnIndex": {
                          "type": "integer",
                          "description": "Indice della colonna nella sezione logica (o -1 se non esiste una colonna contenente il paragrafo, come riquadri, note a piè di pagina, ecc.).",
                          "minimum": -1
                        },
                        "lineNumbering": {
                          "type": "boolean",
                          "description": "true se il paragrafo è contenuto nell'area di numerazione delle righe."
                        },
                        "parIndex": {
                          "type": "integer",
                          "description": "Indice del paragrafo nel blocco o nella cella di tabella.",
                          "minimum": 0
                        },
                        "firstLine": {
                          "type": "integer",
                          "description": "Indice della prima riga del paragrafo nel blocco o nella cella di tabella.",
                          "minimum": 0
                        },
                        "lastLine": {
                          "type": "integer",
                          "description": "Indice dell'ultima riga del paragrafo nel blocco o nella cella di tabella.",
                          "minimum": 0
                        }
                      }
                    }
                  ]
                },
                "text": {
                  "type": "string",
                  "description": "Testo del paragrafo."
                },
                "listReference": {
                  "type": "object",
                  "description": "Riferimento all'elenco contenente il paragrafo.",
                  "properties": {
                    "id": {
                      "type": "string",
                      "description": "ID dell'elenco."
                    },
                    "levelIndex": {
                      "type": "integer",
                      "description": "Indice del livello dell'elemento dell'elenco corrente.",
                      "minimum": 0,
                      "default": 0
                    },
                    "ordinalNumber": {
                      "type": "integer",
                      "description": "Numero ordinale dell'elemento dell'elenco corrente.",
                      "minimum": -1,
                      "default": 0
                    }
                  }
                },
                
              }
            }
          ]
        },
        "lists": {
          "type": "array",
          "description": "Array di elenchi trovati nel documento.",
          "items": [
            {
              "type": "object",
              "description": "Descrizione dell'elenco.",
              "properties": {
                "id": {
                  "type": "string",
                  "description": "ID dell'elenco nel documento."
                },
                "listLevels": {
                  "type": "array",
                  "description": "Array di descrizioni dei livelli dell'elenco.",
                  "items": [
                    {
                      "$ref": "#/definitions/listLevel"
                    }
                  ]
                }
              }
            }
          ]
        }
      }
    }
  }
}```

Schema JSON pubblico

Schema JSON dell’output pubblico di estrazione di Vantage.

Schema XML OCR

Equivalente XML dello schema JSON OCR per l’attività Output.

Attività Output

L’attività Process che genera file di output utilizzando questi schemi.