Zum Hauptinhalt springen

A

ABBYY FlexiCapture

Eine Softwarelösung für die durchgängige Erfassung von Daten aus verschiedenen Dokumenttypen: strukturiert (Formulare mit festem Layout), halbstrukturiert (flexible Formulare und Dokumente) und unstrukturiert (Dokumente mit freiem Format).

ABBYY FlexiLayout Studio

Ein Programm, mit dem Sie ein FlexiLayout für die Dokumentstruktur erstellen können, das anschließend zur automatischen Dokumenterkennung verwendet werden kann.

ABBYY FormDesigner

ABBYY FormDesigner dient zum Entwerfen von Layouts für maschinenlesbare Formulare. Sobald diese vervielfältigt und ausgefüllt wurden, können sie mit dem System zur automatisierten Formulareingabe ABBYY FlexiCapture verarbeitet werden. Das Entwerfen des Formularlayouts ist ein wichtiger Schritt, da die Qualität des entworfenen Layouts (seine Maschinenlesbarkeit) die Effektivität aller nachfolgenden Verarbeitungsschritte bestimmt: Scannen, Erkennung, Verifizierung und Export.

FCFORINVOICES

Ein FC ist eine benutzerfreundliche, intelligente Softwarelösung zur Rechnungsverarbeitung.

ADF

Automatischer Dokumenteneinzug. Ein Gerät für den automatischen Einzug von Dokumenten, mit dem Sie beliebig viele Dokumente scannen können, ohne weitere manuelle Schritte auszuführen.

Administrator

Ein Benutzer von ABBYY FlexiCapture, der berechtigt ist, das Programm für die Erfassung von Dokumenten zu konfigurieren: Dokumentdefinitionen und Importprofile erstellen und bearbeiten.

Alphabet

Eine Gruppe von Zeichen, die in der beschriebenen Sprache verwendet werden.

Anker

Anker sind spezielle Elemente des Formulardesigns, mit denen das System nach dem Scannen ein Matching durchführt (Schieflagen korrigiert, lineare und nichtlineare Scanfehler ausgleicht und die Position von Blöcken berechnet). Die zuverlässigsten Anker sind schwarze Quadrate, die sich normalerweise in den Ecken eines Formulars befinden. Wenn auf dem Bild keine speziellen Anker vorhanden sind, können andere statische Elemente für das Matching der Dokumentdefinition verwendet werden: Trennlinien, d. h. vertikale oder horizontale Linien wie Tabellenlinien, Rahmen usw., oder klarer statischer Text, nämlich Formularüberschriften, Feldbezeichnungen, erläuternde Informationen usw. Für statische Elemente, die für das Dokumentdefinition-Matching verwendet werden, muss die Option Für Dokumentdefinition-Matching verwenden aktiviert sein.

Anker-Barcode

Ein statisches Element, das einen Barcode darstellt und nicht für die Datenextraktion vorgesehen ist. Ein Anker-Barcode kann zum Matching oder zur Identifizierung von Dokumentdefinitionen verwendet werden.

Ankertext

Ein statisches Element, das einen Text auf einem Leerformular darstellt und nicht für die Datenextraktion bestimmt ist. Dabei kann es sich um beliebigen erläuternden Text oder eine Überschrift handeln. Ankertext kann für das Matching oder die Identifizierung von Dokumentdefinitionen verwendet werden.

Winkel

Ein winkelförmiger Anker.

Anhang

Seiten, die keine Felder enthalten, aber bei der Dokumentzusammenstellung berücksichtigt werden. Aus diesen Seiten werden keine Daten extrahiert, sie können jedoch als Bilder oder durchsuchbare PDF-Dateien gespeichert werden. (Administrator) Siehe Erstellen von Dokumentdefinitionen für Dokumente mit Anhängen.

Fehler bei der Dokumentzusammenstellung

Dieser Fehler tritt auf, wenn ein während der Dokumentzusammenstellung erstelltes Dokument Seiten aus anderen Dokumenten enthält, seine eigenen Seiten in der falschen Reihenfolge vorliegen oder die Werte wichtiger Felder auf den Seiten des Dokuments nicht übereinstimmen.

Automatisches Lernen

Die Fähigkeit von ABBYY FlexiCapture, automatisch neue Felder zu erlernen und Dokumenttypen zu identifizieren.

B

Barcode

Ein maschinenlesbares Formularelement, das aus abwechselnd weißen und schwarzen Balken bestimmter Länge besteht und digitale Informationen kodiert. Ein Barcode in einem Dokument kann verwendet werden, um Informationen zu extrahieren (Barcode-Feld) oder zum Abgleich und zur Identifizierung einer Document Definition (Anker-Barcode).

Barcode-Feld

Ein Feld in einer Dokumentdefinition, das einen Barcode enthält und für die Erkennung bestimmt ist.

Barcoderkennung

Umwandlung eines grafischen Barcodes in Zahlen oder Text.

Batch-Typ

Die Eigenschaft eines Batches, die festlegt, wie die Dokumente in den entsprechenden Batches verarbeitet werden. (Administrator) Siehe Batch Types.

Schwarz-Weiß-Linienformular

Ein Formular, bei dem die Begrenzungen der Informationsfelder aus gewöhnlichen Linien bestehen, die beim Scannen nicht verschwinden.

Schwarzes Quadrat

Ein schwarzes Quadrat als Anker.

Helligkeit

Ein Schwellenwert für die Lichtempfindlichkeit, der festlegt, ab wann der Scanner Graustufen-Halbtöne als Weiß erkennt.

C

Häkchen

Ein maschinell lesbares Formularelement, das beim Ausfüllen eines Formulars mit einer Markierung (Haken, Kreuz, Punkt, ausgefüllt usw.) versehen wird.

Häkchenfeld

Ein Feld der Document Definition, das ein Häkchen enthält.

Häkchengruppe

Ein Element eines maschinenlesbaren Formulars, das mehrere nahe beieinanderliegende Häkchen zusammenfasst. In einer Häkchengruppe können ein oder mehrere Häkchen ausgewählt sein.

Häkchengruppenfeld

Ein Feld in einer Document Definition, das eine Häkchengruppe enthält.

Klassifikator

Ein in FlexiLayout Studio erstelltes Projekt, das zur vorläufigen Identifizierung von Seiten dient, bevor Dokumentdefinitionen angewendet werden, sowie zur Auswahl des passenden FlexiLayouts oder der passenden Layout-Alternative.

F-measure des Klassifikators

Ein kombiniertes Maß für Präzision und Recall bei der Dokumentklassifizierung. Sie wird als Zahl zwischen 0 und 1 oder als Prozentsatz zwischen 0 % und 100 % angegeben. Die F-measure für eine Kategorie wird als (β^2 + 1) * P * R / (β^2 * P + R) berechnet, wobei P die Präzision für die Kategorie ist, R der Recall für die Kategorie und β ein freier Parameter, der die relative Gewichtung von Präzision und Recall für das jeweilige Modell bestimmt. Der Maximalwert = 1 (100 %) bei P = R = 1 (100 %). Die F-measure für einen Test-Batch oder Trainings-Batch wird als (β^2 + 1) * P * R / (β^2 * P + R) berechnet, wobei P die Präzision für den Test-Batch oder Trainings-Batch ist, R der Recall für den Test-Batch oder Trainings-Batch und β ein freier Parameter, der die relative Gewichtung von Präzision und Recall für das jeweilige Modell bestimmt.

Codepage

Eine Tabelle mit Werten, die den Zeichensatz einer bestimmten Sprache beschreibt.

Formular mit farbigem Hintergrund

Ein Formular, bei dem alle Informationsfelder als weiße Rechtecke auf einem farbigen Hintergrund erscheinen, der beim Scannen verschwindet.

Kontrast

Verhältnis zwischen der Helligkeit der dunkelsten und der hellsten Bereiche in einem Bild.

Steuerelement

Ein Text-, Feld- oder Schaltflächenelement im Datenformular. (Administrator) Weitere Informationen finden Sie unter Steuerelement einfügen.

Korrigiertes Häkchen

Ein Häkchen, das versehentlich gesetzt und anschließend durchgestrichen wurde. Wenn für das Häkchenfeld die Option Korrekturen zulassen aktiviert ist, erkennt das Programm das durchgestrichene Häkchen als nicht ausgewählt.

Kreuz

Eine Ankermarke in Form eines Kreuzes.

Benutzerdefinierter Datentyp

Benutzerdefinierter Datentyp. (Administrator) Siehe Benutzerdefinierte Datentypen erstellen.

D

Datenbankabgleich

Abgleich erkannter Daten mit entsprechenden Datenbankdatensätzen.

Datensatz

Daten für automatisierte Dokumentprüfungen. Ein Datensatz kann als Tabelle in FC gespeichert und anhand eines Zeitplans synchronisiert oder aus einer externen Quelle abgerufen werden.

Datentyp

Eines der Merkmale eines Felds ist der Datentyp: Number, Datum, Text, Nachname, Vorname, Adresse usw. Ein Datentyp definiert, welche Wörter im jeweiligen Feld vorkommen können. Der Datentyp ist ein wichtiger Erkennungsparameter, der sich auf die Erkennungsqualität auswirkt. Ein korrekt festgelegter Datentyp kann die Anzahl falsch erkannter Zeichen erheblich verringern.

Beschreibungsdatei

Eine Hilfsdatei, die definiert, wie ein Batch zusammengestellt wird, wenn Bilder aus einem Hot Folder hinzugefügt werden. (Administrator) Weitere Informationen finden Sie unter Beschreibungsdatei.

Dictionary

Ein Wörterbuch wird beim Erstellen eines Datentyps festgelegt. Dadurch bestimmt der einem Feld zugeordnete Datentyp, welches Wörterbuch bei der Erkennung und Verifizierung verwendet wird. Zusätzlich zu den vorhandenen vordefinierten Datentypen mit fertigen Wörterbüchern können Sie Feldern auch Datentypen zuordnen, die auf benutzerdefinierten Wörterbüchern basieren. Sie können Wörterbuchdaten manuell eingeben oder aus einer Datei laden.

Dokument

Eine Kombination aus einem oder mehreren Seitenbildern und den daraus extrahierten Daten.

Dokumenten-Batch

Eine vom Benutzer gruppierte Zusammenstellung von Dokumenten. Ein Batch enthält normalerweise den Stapel von Dokumenten, die in einem einzigen Durchgang gescannt oder aus einem bestimmten Ordner importiert wurden. (Administrator) Siehe Dokumenten-Batches.

Dokumentenklasse

Eine Gruppe von Dokumenten oder Seiten, die mehrere gemeinsame Merkmale aufweisen.

Dokumentdaten

Daten, die nach der Verarbeitung von Dokumentseitenbildern (Erkennung, Verifizierung und Bearbeitung der Erkennungsergebnisse) erfasst werden.

Dokumentdefinition

Eine Dokumentdefinition legt die Prinzipien für die Identifizierung und Verarbeitung eines bestimmten Dokumenttyps fest und enthält:
  • die Dokumentstruktur, d. h. eine Beschreibung der zulässigen Seitenreihenfolge für Dokumente dieses Typs, die festlegt, wie Dokumente zusammengesetzt werden sollen
  • Definitionen von Dokumentabschnitten
  • eine Liste von Regeln, die Felddaten erfüllen müssen
  • die Positionen von Feldern und ihren Signaturen im Datenfenster (Datenformularansicht)
  • Exporteinstellungen für Dokumente
  • Einstellungen für die Dokumentverarbeitung

Identifizierung der Dokumentdefinition

Prozess zur Auswahl der erforderlichen Dokumentdefinition anhand von Bezeichnern.

Dokumentdefinition Matching

Ein Prozess zur Auswahl einer Dokumentdefinition und für das Matching ihrer Felder mit einem Bild.

Veröffentlichung einer Dokumentdefinition

Gibt nach der Bearbeitung den Zugriff auf eine neue Version einer Dokumentdefinition frei. Eine veröffentlichte Version nimmt an der Verarbeitung von Dokumenten aus Arbeits-Batches teil, während eine unveröffentlichte lokale Version nur an der Verarbeitung von Dokumentdefinitionen aus Test-Batches teilnehmen kann. (Administrator) Siehe Bearbeiten und Veröffentlichen einer Dokumentdefinition.

Abschnitt einer Dokumentdefinition

Eine Komponente einer Dokumentdefinition. Entspricht einer oder mehreren Seiten, die einen logisch vollständigen Feldsatz enthalten. Felder innerhalb eines Abschnitts können sich von einer Seite auf die nächste fortsetzen (zum Beispiel mehrseitige Tabellen), während sich Feldsätze aus verschiedenen Abschnitten nicht überschneiden. Eine Abschnittsdefinition kann flexibel oder fest sein.

Dokumentidentifikation

Die Zuordnung von Dokumenten zu einem von mehreren vordefinierten Dokumenttypen.

Dokumentensatz

Eine Gruppe logisch zusammengehöriger Dokumente, die für einen bestimmten Zweck verwendet werden. So kann beispielsweise ein Geschäftsprozess durch einen vom Antragsteller eingereichten Dokumentensatz eingeleitet werden, der aus einem ausgefüllten Antragsformular und einigen Begleitdokumenten besteht. Je nach den Angaben, die der Antragsteller im Antragsformular macht, können einige der Begleitdokumente optional sein, während andere dem Antrag beigefügt werden müssen.

Dokumenttext

Der gesamte Text des Dokuments, der bei der vorläufigen Erkennung erfasst wurde, bevor das FlexiLayout angewendet wird. Sie können diesen Text speichern (dafür ist zusätzlicher Speicherplatz auf der Festplatte erforderlich), damit er bei der Verifizierung verwendet werden kann.

Dokumenttyp

Eine Gruppe von Dokumenten, die mehrere gemeinsame Merkmale aufweisen und in Geschäftsprozessen eine bestimmte Rolle spielen. Beispiele für Dokumenttypen sind Rechnungen, Verträge und Reisepässe.

Dokumentvariante

Mehrere Dokumente desselben Typs, die mehrere gemeinsame Merkmale aufweisen. Beispiele für Dokumentvarianten sind Rechnungen von verschiedenen Lieferanten und Kontoauszüge derselben Bank.

Nadeldrucker

Eine Art von erkennbarem Text, die einen Text bezeichnet, der mit einem Nadeldrucker gedruckt wurde.

dpi

Punkte pro Zoll. Anzahl der Punkte pro Zoll; eine Maßeinheit für die Bildauflösung.

E

Entität

Ein Feld oder eine Gruppe von Feldern mit Informationen, die mithilfe von NLP-Technologie extrahiert werden müssen. Beispiele für Entitäten sind Personen, Unternehmen, Orte, Beträge und Datumsangaben.

Umgebungsvariable

Eine Zeichenfolge zum Speichern von Text, z. B. von Systemeinstellungen. Umgebungsvariablen können zum Speichern von Datenbank-Verbindungszeichenfolgen und Variablen verwendet werden, die zur Angabe der Namen exportierter Dateien dienen.

Fehler / Warnung

Ein Fehler bzw. eine Warnung tritt auf, wenn aus einem oder mehreren Feldern extrahierte Daten die bei automatischen Prüfungen angewendeten Regeln nicht erfüllen oder nicht dem angegebenen Format entsprechen. Es gibt zwei verschiedene Arten von Fehlern und Warnungen:
  • Einzelfeldfehler / -warnungen werden durch Regeln und Formate erzeugt, die sich auf ein Feld beziehen;
  • Mehrfeldfehler / -warnungen werden durch Regeln erzeugt, die sich auf mehrere Felder beziehen.

Erläuterungstext

Ein maschinenlesbares Formularelement, das einen beschreibenden Text enthält (Formularname, Feldnamen, Erläuterungen zu Feldern usw.).

Export

Übertragung verarbeiteter Daten an ein externes Informationssystem oder in eine Datei.

Exportprofil

Eine Konfiguration von Einstellungen, die bestimmt, was mit verarbeiteten Daten geschieht: das Format der Ausgabedateien, der Ausgabepfad, Exportbedingungen usw.

Externe Datenbank

Eine Textdatei oder eine ODBC-kompatible Datenbank, in der Referenzdaten gespeichert werden. Referenzdaten können mögliche Werte erfasster Felder oder Informationen umfassen, die für die Erfassung von Feldern benötigt werden.

F

Feld

Ein Dokumentelement zur Datenextraktion. Felder können einfach (ohne interne Struktur) oder zusammengesetzt sein, etwa ein Tabellenfeld, bei dem jede Zelle als separates untergeordnetes Feld der Tabelle betrachtet werden kann. (Administrator) Siehe Erstellen von Dokumentdefinition-Feldern.

Feldregion

Eine in der Dokumentdefinition hervorgehobene Bildregion, die für die Datenextraktion vorgesehen ist.

Feldverifizierung

Im Modus der Feldverifizierung werden unsichere Zeichen im Kontext des gesamten Feldes geprüft. Felder, für die die Option An die Feldverifizierung senden aktiviert ist, werden zur Feldverifizierung weitergeleitet. Wir empfehlen, Felder zur Feldverifizierung weiterzuleiten, deren Wertebereich bekannt ist oder sich leicht bestimmen lässt. Beispiele für solche Felder sind Länder- oder Städtenamen: Wir wissen, welche Werte dieses Feld annehmen kann.

Feld mit mehreren Instanzen

Ein Feld, mit dem mehrere Objekte desselben Typs beschrieben werden (wiederkehrende Objekte). Im Wesentlichen sind diese mehreren Objekte ein und dasselbe Feld und haben dieselben Eigenschaften. Felder mit mehreren Instanzen werden verwendet, damit nicht mehrere identische Felder erstellt werden müssen. Felder mit mehreren Instanzen werden in separate Dateien oder Datenbanktabellen exportiert. (Administrator) Siehe Felder mit mehreren Instanzen.

Feld mit mehreren Regionen

Ein Feld, das aus mehreren Regionen im Bild besteht. Solche Regionen können in einigem Abstand voneinander und sogar auf verschiedenen Seiten liegen. Werte aus allen Regionen, die zu demselben Feld gehören, werden zusammengeführt und gemeinsam als ein Feld exportiert. Wird normalerweise für Objekte verwendet, die sich über mehrere Seiten erstrecken, z. B. große Tabellen. (Administrator) Siehe Felder mit mehreren Regionen.

Feld ohne Region

Ein in einer Dokumentdefinition erkanntes Feld, das jedoch keine Region auf dem Bild hat. (Administrator) Siehe Felder ohne Region.

Festes Formular

Ein Dokument mit festen Informationsfeldern, deren Formatierung, Anzahl und Layout strikt definiert sind und sich von einer Dokumentinstanz zur nächsten nicht ändern.

Feste Dokumentdefinition

Eine Definition eines Dokuments oder eines seiner Abschnitte, die für die Verarbeitung fester Formulare ausgelegt ist. Felder in einer festen Dokumentdefinition haben feste Positionen.

FlexiLayout

Beschreibung der Struktur eines semistrukturierten Dokuments. Diese Beschreibung wird in ABBYY FlexiLayout Studio erstellt und in ABBYY FlexiCapture exportiert. Dateiformat *.afl. FlexiLayout ist eine Art Anweisung zur Erkennung und Identifizierung von Feldern in einem flexiblen Formular.

FlexiLayout-Variante

Ein FlexiLayout für eine Dokumentvariante, das entweder speziell für diese Dokumentvariante entwickelt oder anhand dieser Dokumentvariante trainiert wurde. Wird in Verbindung mit einem generischen FlexiLayout verwendet.

Flexible Dokumentdefinition

Eine Definition eines Dokuments oder eines seiner Abschnitte, die für die Verarbeitung semistrukturierter Dokumente konzipiert ist. Erstellt durch Anhängen eines FlexiLayout. Felder in einer solchen Dokumentdefinition haben keine festen Positionen. Sie werden mithilfe eines FlexiLayouts erkannt. (Administrator) Siehe Erstellen einer Dokumentdefinition für die Verarbeitung semistrukturierter Dokumente.

Formular

Ein Dokument, das aus einer oder mehreren Seiten besteht und dazu bestimmt ist, von einer Person von Hand oder mithilfe eines anderen Druckverfahrens ausgefüllt zu werden.

Text im Rahmen

Art der Textmarkierung, bei der ein Rahmen den Text umgibt.

Gerahmter Text über einem Kamm

G

Formular mit grauem Hintergrund

Ein Formular, bei dem alle Informationsfelder aus weißen Rechtecken auf grauem Hintergrund bestehen, der beim Scannen verschwindet.

Gruppenverifizierung

Felder, für die die Option An die Gruppenverifizierung senden aktiviert ist, werden zur Gruppenverifizierung gesendet. Wir empfehlen, Zeichen in Zahlenfeldern sowie Häkchen zur Gruppenverifizierung zu senden.

H

Handgeschriebene Druckschrift

Eine Art von erkennbarem Text, der von Hand in deutlicher Druckschrift geschrieben ist.

Handschriftlicher Text

Eine Art von Text, dessen Buchstaben ganz oder teilweise miteinander verbunden sind. Hinweis: Derzeit kann nur englischer handschriftlicher Text erkannt werden.

Hotfolder

Ein Ordner auf der Festplatte eines lokalen oder entfernten Computers, der zum Importieren von Bildern verwendet wird. Er wird normalerweise für den regelmäßigen, wiederkehrenden Upload von Bildern ohne Zutun des Benutzers verwendet. (Administrator) Siehe Bildimportprofile.

Bezeichner

Ein statisches Element, das zur Identifizierung einer Dokumentdefinition aus mehreren Dokumentdefinitionen mit identischen Positionen von Ankern verwendet wird. Die Option Use for Document Definition identification muss in den Eigenschaften solcher statischen Elemente aktiviert werden.

Identitätsanbieter

Ein Drittsystem wie Azure AD, OneLogin oder Okta, das Identitätsinformationen verwaltet und seinen Clients Authentifizierungsdienste bereitstellt, sodass ein Endbenutzer durch die einmalige Eingabe seiner Zugangsdaten auf alle autorisierten Ressourcen in seinem lokalen Netzwerk zugreifen kann.

Ignoriertes Zeichen

Diese Zeichen werden bei Wörtern ausgeschlossen, d. h., die Wörter werden auch ohne diese Zeichen einem bestimmten Datentyp zugeordnet.

Image

Das elektronische Abbild einer gescannten Seite eines Papierdokuments.

Entfernung von Störpunkten

Entfernung von Rauschen aus dem Bild. Rauschen kann beim Scannen entstehen; daher wird empfohlen, es zu entfernen, um die Datenerkennung zu verbessern. Bei der Entfernung von Störpunkten entfernt das Programm auch Hintergrundpunkte oder Begrenzungslinien in Rasterformularen.

Bildimport

Das Hinzufügen von Bildern zu einem Batch zur Verarbeitung. Der Import kann durch das Hinzufügen von Bildern aus Dateien, von einem Scanner oder mithilfe von Importprofilen erfolgen. (Administrator, Verifizierung) Siehe Hinzufügen von Seitenbildern.

Bilddrehung

Drehung eines Bildes um seinen Mittelpunkt.

Importprofil

Eine Kombination aus Einstellungen, mit der Bilder zu einem Batch hinzugefügt werden: Importquelle, Optionen für die Bildverarbeitung, Optionen zum Bereinigen des Hot Folder usw. (Administrator) Siehe Bildimportprofile.

Fehlerhaft erkanntes Zeichen

Status, der einem Zeichen während der Erkennung automatisch zugewiesen wird, wenn es mit erheblicher Unsicherheit erkannt wurde.

Indexfeld

Ein Feld, dessen Wert zur Indizierung von Dokumenten für Sortier- und Suchzwecke verwendet wird. (Administrator) Siehe Indexfelder.

Invertiertes Bild

Ein Bild mit hellem Text vor dunklem Hintergrund.

Rechnung

Ein Dokument, in dem die gelieferten Waren, ihre Menge, ihr Preis, ihre Merkmale (wie Farbe, Gewicht usw.), die Versandbedingungen und die Angaben zu den Parteien aufgeführt sind. Rechnungen können mit einer separaten Lösung, FCFORINVOICES, verarbeitet werden. (Administrator, Verifizierung) Siehe ABBYY FlexiCapture for Invoices.

ICR, intelligente Zeichenerkennung

Dies bezeichnet Technologien oder Systeme zur Massenverarbeitung von Dokumenten, die mit handgeschriebenen Druckbuchstaben und Zahlen ausgefüllt sind, also die Erkennung handgeschriebener Druckzeichen.

K

Schlüsselfeld

Ein Feld, das die automatische Prüfung der Seitenzusammenstellung zu Dokumenten ermöglicht. Die Werte von Schlüsselfeldern müssen auf allen Seiten desselben Dokuments identisch sein.

L

Sprache (lokal)

Eine Feldeigenschaft, die die Schreibsprache und die zugehörigen Sätze regionaler Parameter festlegt (z. B. die Schreibweise von Datumsangaben oder Adressen).

Layout

Die Position der Felder auf einem Dokumentbild. Layouts können automatisch generiert oder manuell erstellt werden. (Administrator) Siehe auch Referenzlayout.

Eingerahmte Buchstaben

Buchstaben in einzelnen Rahmen

Buchstaben über einem Kamm

M

Maschinell gedruckter Text

Eine Art von Text, der mit typografischen Geräten oder einem Laser- oder Tintenstrahldrucker mit einer Mindestauflösung von 300 dpi gedruckt wurde.

Maschinenlesbares Formular

Ein Formular, das speziell für die automatisierte Erfassung konzipiert ist. Es enthält Elemente (Anker, Barcodes, Zeilen usw.), die für eine erfolgreiche Verarbeitung erforderlich sind.

Feld für die manuelle Eingabe

Ein Feld in einer Dokumentdefinition, das nicht erkennbaren Text enthält (zum Beispiel Text aus verschmolzenen Buchstaben), der über die Tastatur eingegeben werden muss.

MRC (Mixed Raster Content)

Eine Komprimierungsmethode für Bilder, die sowohl Text als auch Rasterfragmente enthalten. Das Bild wird in Fragmente zerlegt, und für jedes Fragment wird ein optimaler Komprimierungsalgorithmus ausgewählt. Dieser Ansatz ermöglicht bessere Komprimierungsraten bei gleichbleibender visueller Bildqualität.

Nichtproportionaler Text

Art der Textmarkierung, bei der sich jeder Buchstabe innerhalb eines Rahmens gleicher Höhe und Breite befindet, dessen Rand beim Scannen jedoch verschwindet.

Mehrseitiges Dokument

Ein Dokument mit mehreren Seiten.

Mehrmandantenfähigkeit

Eine Funktion, die es mehreren unabhängigen Benutzern ermöglicht, ABBYY FlexiCapture zu nutzen. Die Daten jedes Mandanten sind vollständig von denen anderer Mandanten getrennt, und das System weist jedem Mandanten einen Teil seiner Ressourcen zu.

N

NER (Named-Entity Recognition) Eine Informationsextraktionsaufgabe, bei der in unstrukturiertem Text nach Attributen gesucht und diese in vordefinierte Kategorien klassifiziert werden. NLP (Natural Language Processing) Ein Teilgebiet der künstlichen Intelligenz und der mathematischen Linguistik. Es befasst sich mit der computergestützten Analyse und Synthese natürlicher Sprachen. Eine mögliche Anwendung ist die Extraktion aussagekräftiger Informationen aus Text. Dazu gehören unter anderem maschinelle Übersetzung, Chatbots, Klassifizierung, Tonalitätsanalyse, Datenextraktion usw.

NLP-Modell

Ein Mechanismus, der festlegt, welche Entitäten und Segmente aus Texten extrahiert werden sollen und auf welche Weise. Das Themengebiet und der Extraktionsalgorithmus werden beim Training eines NLP-Modells ausgewählt.

O

OCR (Optical Character Recognition)

Optische Erkennung von gedruckten Texten.

OMR (Optische Markierungserkennung)

Diese Technologie ermöglicht ABBYY FlexiCapture, sowohl normale Markierungen (Häkchen, Kreuze usw.) auf Formularen mit hoher Zuverlässigkeit zu erkennen als auch versehentlich gesetzte und anschließend geschwärzte Markierungen korrekt zu identifizieren.

Operator

Ein Benutzer von ABBYY FlexiCapture, der für die Dokumentenerfassung zuständig ist: Bilder hinzufügen, Erkennung und Verifizierung durchführen, erkannte Daten exportieren.

Operator-Rolle

Die Eigenschaft eines Benutzerkontos in ABBYY FlexiCapture, die festlegt, auf welche Daten der Benutzer zugreifen kann und welche Aktionen mit diesen Daten ausgeführt werden dürfen. (Administrator, Verifizierung) Siehe Arbeiten mit einem konfigurierten Projekt.

Überlagerung

Der Vorgang, bei dem im Dokumentdefinition Editor ein Scan eines ausgefüllten Formulars mit dem Bild eines leeren Beispiels desselben Formulars kombiniert wird.

P

Seite

Abbildung einer Papierdokumentseite und der Verarbeitungsergebnisse.

Seitenlayout

Eine schematische Darstellung der Position der Felder auf einem Bild.

Seitenorientierung

Ausrichtung der Seite relativ zur Standardausrichtung: von oben nach unten, von links nach rechts. Die Seitenorientierung kann bei der Erkennung des Seitenbilds automatisch bestimmt werden. Dazu können Sie in ABBYY FlexiCapture mögliche Orientierungen angeben.

Bild

Ein Element eines maschinenlesbaren Formulars, das nicht erkannt wird, sondern zum Export als grafisches Objekt bestimmt ist (zum Beispiel als Datei).

Bildfeld

Ein Feld einer Document Definition, das ein Bild enthält. Präzision Eine Kennzahl, mit der der Benutzer die Qualität der automatischen Klassifizierung bewerten kann. Sie wird berechnet, indem die Anzahl der korrekt als Klasse A identifizierten Dokumente durch die Gesamtzahl aller als Klasse A identifizierten Dokumente geteilt wird (sowohl der korrekt als auch der inkorrekt identifizierten).

Vorerkennung

Volltexterkennung von Dokumentbildern, um die Felderkennung mithilfe einer Dokumentdefinition zu erleichtern.

Verarbeitungsleistung

Die durchschnittliche Anzahl an Seiten, Dokumenten oder Batches, die in einem bestimmten Zeitraum verarbeitet werden.

(Distributed) Verarbeitungsstufe

(Distributed) Eine Workflow-Stufe, in der bestimmte Aktionen an einem Dokument oder Batch ausgeführt werden (entweder automatisch oder durch einen Operator). (Administrator, Developer, Distributed) Siehe Verarbeitungsstufen und Warteschlangen.

Verbotenes Zeichen

Die Angabe solcher Zeichen kann die Geschwindigkeit und Qualität der Erkennung erheblich verbessern. Wenn Sie beispielsweise Texte erkennen, die nur Großbuchstaben enthalten, geben Sie alle Kleinbuchstaben als verbotene Zeichen an.

Projekt

Ein Projekt ist eine eigenständige Umgebung, in der die für die Verarbeitung erforderlichen Dokument-Batches und Einstellungen zusammengefasst sind, z. B. Dokumentdefinitionen, Importprofile usw. (Administrator) Siehe Erstellen eines Projekts.

(Distributed) Q

(Distributed) Warteschlange

(Distributed) Zu Aufgaben und/oder Batches zusammengefasste Dokumente, die in einer bestimmten Verarbeitungsstufe auf die Verarbeitung warten. (Administrator, Developer, Distributed) Siehe Verarbeitungsstufen und Warteschlangen.

R

Rasterformular

Ein Formular, in dem Felder als weiße Rechtecke vor einem grauen Hintergrund dargestellt werden, der aus Rasterlinien besteht, oder als Rechtecke, die durch Rasterlinien begrenzt werden.

Rasterlinie

Eine Linie aus gleichmäßig angeordneten Punkten. Recall Eine Kennzahl, mit der Benutzer die Qualität der automatischen Klassifizierung bewerten können. Sie wird berechnet, indem die Anzahl der korrekt identifizierten Dokumente der Klasse A durch die Gesamtzahl aller Dokumente der Klasse A geteilt wird.

Erkennung

Ein Prozess, bei dem Bildelemente mit bestimmten Zeichen abgeglichen werden.

Erkennungssprache

Eine Sprache, die von ABBYY FlexiCapture für die Text­erkennung verwendet wird. Referenzklassen Eine Referenzklasse ist eine Klasse, die einem Dokument von einem Experten im Rahmen der manuellen Klassifizierung zugewiesen wurde. Sowohl ein Abschnitt eines Dokuments als auch eine Dokumentvariante können eine Referenzklasse sein.

Referenzlayout

Ein benutzerdefiniertes Layout, das als Referenz für automatisch erstellte Layouts dient. Anhand dieses Vergleichs wird bewertet, wie gut das Programm Feldregionen erkennt.

(Administrator) Regulärer Ausdruck

(Administrator) Beschreibung der Struktur eines Wortes oder eines beliebigen eingegebenen Werts mithilfe einer speziellen Sprache. Das Programm ermöglicht es Ihnen, nicht nur die zulässigen Zeichen, sondern auch die Struktur von Feldinhalten anzugeben. Sie können die Struktur mit einem regulären Ausdruck beschreiben, wenn Sie Einschränkungen für ein Textfeld festlegen oder einen benutzerdefinierten Datentyp erstellen. Siehe Alphabet in regulären Ausdrücken.

Auflösung

Image-Parameter. Die Auflösung wird in dpi (Dots per Inch) gemessen. Ergebnisklassen Eine Ergebnisklasse ist eine Klasse, die einem Dokument bei der automatischen Klassifizierung zugewiesen wurde.

Regelprüfung

Eine automatische Prüfung erkannter Daten anhand vordefinierter Regeln. Siehe Regelprüfung.

Regeln

Bestimmte Bedingungen, die für Daten in Feldern gelten und vom Programm automatisch geprüft werden. (Administrator, Verifizierung) Siehe Regelprüfung.

S

Scannen

Der Vorgang, bei dem mithilfe eines Scanners ein elektronisches Bild eines Papierformulars erstellt wird. Segment Ein Textfragment, das aus einem oder mehreren Absätzen besteht und Daten enthält, die extrahiert werden müssen. Ein Segment kann auch ein Feld sein, das extrahiert werden muss (zum Beispiel Bedingungen für die Beendigung eines Vertrags). Segmentation Der Prozess der Identifizierung von Segmenten. Die Segmentierung geht der Informationsextraktion voraus und ist besonders bei großen Dokumenten nützlich, da sie die Suche nach Entitäten auf bestimmte Textfragmente eingrenzt.

Abschnitt

Ein logisch abgegrenzter Teil eines Dokuments, der eine Reihe extrahierbarer Felder enthält. Abschnitte werden während des Erkennungsprozesses für verschiedene Zwecke verwendet, etwa zum Zusammenstellen von Dokumenten aus Seiten. Abschnitte können eine einzelne Seite oder mehrere Seiten umfassen und fest oder flexibel sein. (Administrator) Siehe Erstellen von Dokumentdefinitionen für mehrseitige Dokumente.

Semi-strukturiertes Dokument

Dokument mit einer Reihe von Informationsfeldern, deren Gestaltung, Anzahl und Layout je nach Dokumentinstanz erheblich variieren können. Siehe Welche Dokumenttypen sich mit ABBYY FlexiCapture verarbeiten lassen.

Trennlinie

Ein maschinenlesbares Formularelement, das eine vertikale oder horizontale Linie darstellt.

Servicefeld

Ein Feld, das keine Region im Dokumentbild hat. Die Werte von Servicefeldern werden automatisch anhand von Daten aus der in ihren Eigenschaften angegebenen Quelle bestimmt. (Administrator) Siehe Servicefelder.

Satz zulässiger Zeichen

Dieser Satz wird durch den Datentyp bestimmt. Das heißt: Die Art der Daten, die einem Feld zugewiesen sind, bestimmt den Zeichensatz, der bei der Erkennung verwendet wird.Sie können nicht nur die in diesem Satz enthaltenen Zeichen auswählen, sondern auch zusätzliche Parameter konfigurieren, die diesen Satz weiter einschränken. Sie können beispielsweise Folgendes festlegen:
  • Zeichen, von denen Sie wissen, dass sie bei der Erkennung eines bestimmten Felds nicht vorkommen, als verbotene Zeichen (zum Beispiel können Sie alle Kleinbuchstaben für ein Feld als verboten festlegen, wenn dort nur Großbuchstaben vorkommen dürfen).
  • Zeichen, die innerhalb von Wörtern vorkommen können, ohne deren Verifizierung zu beeinflussen, als ignorierte Zeichen (zum Beispiel Bindestriche, Betonungszeichen usw.).

Einfacher Text

Eine Art der Textmarkierung, bei der Text ohne Trennzeichen in einen Block eingefügt wird.

Dateneingabe in einem einzigen Flow

Automatisierte Datenextraktion aus analogen (gedruckten) und digitalen (gescannten Bilddokumenten) Dokumenten.

Dokumenteneingabe in einem einzelnen Workflow

Automatische Umwandlung von Papierdokumenten in elektronische Form.

SLA (Service Level Agreement)

Eine Vereinbarung, die die Erbringung von IT-Dienstleistungen regelt. In ABBYY FlexiCapture 12 regelt eine SLA-Vereinbarung die Fristen für die Verarbeitung von Batches.

Statische Elemente

Nicht erkennbare Elemente, die für das Matching und die Identifizierung in der Dokumentdefinition vorgesehen sind. Solche Elemente sind: Anker, Ankertext, Trennlinien, Anker-Barcodes.

Abschnitt „Zusammenfassung“

Der Abschnitt „Zusammenfassung“ ist ein Abschnitt einer Dokumentdefinition, in dem alle Hauptfelder eines Dokumentensatzes angezeigt werden. Das erleichtert es Operatoren erheblich, Dokumente in einem Satz zu überprüfen, weil sie alle Fehler und Daten mit niedrigem Konfidenzwert an einer Stelle sehen und nur die Dokumente öffnen müssen, die überprüft werden müssen, statt jedes einzelne Dokument zu öffnen.

T

Tabelle

Daten, die in einem zweidimensionalen Raster angeordnet sind und nicht unbedingt sichtbar sein müssen. Das Programm verarbeitet Tabellen, die aus Spalten mit gleichartigem Datentyp und sich wiederholenden Zeilen bestehen.

Tabellenfeld

Ein Dokumentdefinition-Feld, das eine Tabelle enthält. Es handelt sich um ein zusammengesetztes Feld; dabei repräsentiert jede Tabellenspalte einen Feldsatz desselben Typs: Text, Häkchen, Barcodes oder Bilder.

(Distributed) Aufgabe

(Distributed) Eine Menge von Dokumenten aus demselben Batch, die zusammen verarbeitet wird. Je nach Projekteinstellungen und Verarbeitungsstufe kann eine Aufgabe unterschiedlich viele Dokumente enthalten. Wenn in einer Verarbeitungsstufe ein Batch vollständig verarbeitet werden muss, wird der gesamte Batch in die Aufgabe aufgenommen. Werden Verifizierungsaufgaben automatisch erstellt, enthält jede Aufgabe 10 Dokumente (enthält ein Batch weniger als 10 nicht verifizierte Dokumente, werden sie alle als eine Aufgabe verarbeitet).

Tenant

Eine isolierte Instanz von ABBYY FlexiCapture, die unabhängig von anderen Benutzern genutzt werden kann.

Test-Batches

Dokumenten-Batches, die für das Testen und die Konfiguration von Dokumentdefinition vorgesehen sind. Zur Verarbeitung von Test-Batches werden lokale Kopien von Dokumenten-Batches verwendet. (Administrator) Siehe Dokumenten-Batches.

Textfeld

Ein maschinenlesbares Formularelement für die Eingabe von Text beim Ausfüllen eines Formulars.

Textfeldmarkierung

Ein grafisches Element zur Begrenzung eines Textfelds: Rahmen, Kamm, Linie.

Textmarkierung

Die Gestaltung einer Seitenregion für die Texteingabe. (Administrator) Siehe Beispiele für Textformatierungen im Thema Eingabefeld.

Textausrichtung

Ausrichtung des Textes in einem Feld relativ zur Seite.

Texterkennung (OCR, ICR)

Umwandlung eines Bildes in Text.

Textprobe

Eine Datei mit Beispielen für alle Zeichen des Alphabets.

Training [Dokumentdefinition]

Eine Funktion in FCFORINVOICES, mit der Benutzer das Programm darauf trainieren können, Daten aus bestimmten Rechnungsarten zu erfassen. Das Training verbessert die Qualität der Datenerfassung und kann entweder beim Einrichten des Programms oder während der Verarbeitung von Rechnungen durchgeführt werden.

Trainings-Batches

Ein Batch von Dokumenten, der zum Trainieren und Testen einer Dokumentdefinition für eine bestimmte Dokumentvariante verwendet wird. Beim Trainieren einer Dokumentdefinition mit einem Trainings-Batch wird eine FlexiLayout-Variante erstellt. Siehe auch Dokument-Batch, Dokumentvariante, FlexiLayout-Variante.

Schreibmaschinenschrift

Eine Art von erkennbarem Text, der mit einer Schreibmaschine gedruckten Text darstellt.

U

Unterstrichener Text

Benutzerwörterbuch

Ein vom Benutzer erstelltes zusätzliches Wörterbuch, das Wörter enthält, die nicht in den integrierten Wörterbüchern enthalten sind. Integrierte Wörterbücher können durch ein Benutzerwörterbuch ergänzt werden, um die Qualität der Datenerfassung zu verbessern. Ein Benutzerwörterbuch enthält in der Regel Fachbegriffe, Abkürzungen, Firmennamen usw.

Nicht erkennbare Region

Eine Bildregion, die von der Erkennung ausgeschlossen ist. Eine nicht erkennbare Region wird benötigt, um eine Region mit erläuterndem Text oder Bild auszuschließen, die die Felderkennung erschwert. (Administrator) Siehe Eine Region von der Erkennung ausschließen.

Unstrukturiertes Dokument

Ein Dokument, dessen Informationen in freier Form dargestellt sind. Beispiele für solche Dokumente sind Verträge, Briefe, Bestellungen und Grafiken. (Administrator) Siehe Erstellen von Dokumentdefinitionen für unstrukturierte und semi-strukturierte Dokumente.

V

Vendor

Eine juristische oder natürliche Person, die Waren oder Dienstleistungen verkauft. Ein Vendor stellt für seine Waren und Dienstleistungen Rechnungen aus. Daten aus Rechnungen können mit FCFORINVOICES erfasst werden.

Verifizierung

Bei der Verifizierung wird geprüft, ob die Daten erkannt wurden, die Seiten korrekt zu Dokumenten zusammengestellt wurden und die Regeln keine Fehler ergeben haben. (Standalone) Die Verifizierung wird auf der Operator Station durchgeführt. (Distributed) Die Verifizierung wird auf der Data Verification Station (wo die Erkennungsgenauigkeit verifiziert wird) und auf der Verifizierungsstation (wo alle Arten von Prüfungen durchgeführt werden können) durchgeführt. (Administrator, Verification) Siehe Verifizierung.

W

Arbeitsbatches

Dokumenten-Batches für die Dateneingabe. Für die Verarbeitung von Arbeitsbatches werden nur veröffentlichte Dokumentdefinitionen verwendet. (Administrator) Siehe Dokumenten-Batches.

Schriftstil

Diese Option dient zum Konfigurieren des Schriftstils handschriftlicher Druckbuchstaben in Formularen. Die Wahl des Schriftstils hängt von der Region ab, in der die Formularverarbeitung erfolgt (Russland, Deutschland, die Tschechische Republik, die USA usw.).

X

XFD

XML-Formulardefinition (*.xfd), ein spezielles Dateiformat für ein mit ABBYY FormDesigner entworfenes Formular. Mit einer Datei im XML-Formulardefinitionsformat werden Dokumentdefinitionen in ABBYY FlexiCapture erstellt.