A
ABBYY FlexiCapture
Eine Softwarelösung für die durchgängige Erfassung von Daten aus verschiedenen Dokumenttypen: strukturiert (Formulare mit festem Layout), halbstrukturiert (flexible Formulare und Dokumente) und unstrukturiert (Dokumente mit freiem Format).ABBYY FlexiLayout Studio
Ein Programm, mit dem Sie ein FlexiLayout für die Dokumentstruktur erstellen können, das anschließend zur automatischen Dokumenterkennung verwendet werden kann.ABBYY FormDesigner
ABBYY FormDesigner dient zum Entwerfen von Layouts für maschinenlesbare Formulare. Sobald diese vervielfältigt und ausgefüllt wurden, können sie mit dem System zur automatisierten Formulareingabe ABBYY FlexiCapture verarbeitet werden. Das Entwerfen des Formularlayouts ist ein wichtiger Schritt, da die Qualität des entworfenen Layouts (seine Maschinenlesbarkeit) die Effektivität aller nachfolgenden Verarbeitungsschritte bestimmt: Scannen, Erkennung, Verifizierung und Export.FCFORINVOICES
ADF
Administrator
Alphabet
Anker
Details...
Details...
Anker sind spezielle Elemente des Formulardesigns, mit denen das System nach dem Scannen ein Matching durchführt (Schieflagen korrigiert, lineare und nichtlineare Scanfehler ausgleicht und die Position von Blöcken berechnet). Die zuverlässigsten Anker sind schwarze Quadrate, die sich normalerweise in den Ecken eines Formulars befinden. Wenn auf dem Bild keine speziellen Anker vorhanden sind, können andere statische Elemente für das Matching der Dokumentdefinition verwendet werden: Trennlinien, d. h. vertikale oder horizontale Linien wie Tabellenlinien, Rahmen usw., oder klarer statischer Text, nämlich Formularüberschriften, Feldbezeichnungen, erläuternde Informationen usw. Für statische Elemente, die für das Dokumentdefinition-Matching verwendet werden, muss die Option Für Dokumentdefinition-Matching verwenden aktiviert sein.
Anker-Barcode
Ein statisches Element, das einen Barcode darstellt und nicht für die Datenextraktion vorgesehen ist. Ein Anker-Barcode kann zum Matching oder zur Identifizierung von Dokumentdefinitionen verwendet werden.Ankertext
Ein statisches Element, das einen Text auf einem Leerformular darstellt und nicht für die Datenextraktion bestimmt ist. Dabei kann es sich um beliebigen erläuternden Text oder eine Überschrift handeln. Ankertext kann für das Matching oder die Identifizierung von Dokumentdefinitionen verwendet werden.Winkel
Ein winkelförmiger Anker.Anhang
Seiten, die keine Felder enthalten, aber bei der Dokumentzusammenstellung berücksichtigt werden. Aus diesen Seiten werden keine Daten extrahiert, sie können jedoch als Bilder oder durchsuchbare PDF-Dateien gespeichert werden. (Administrator) Siehe Erstellen von Dokumentdefinitionen für Dokumente mit Anhängen.Fehler bei der Dokumentzusammenstellung
Automatisches Lernen
B
Barcode
Ein maschinenlesbares Formularelement, das aus abwechselnd weißen und schwarzen Balken bestimmter Länge besteht und digitale Informationen kodiert. Ein Barcode in einem Dokument kann verwendet werden, um Informationen zu extrahieren (Barcode-Feld) oder zum Abgleich und zur Identifizierung einer Document Definition (Anker-Barcode).Barcode-Feld
Ein Feld in einer Dokumentdefinition, das einen Barcode enthält und für die Erkennung bestimmt ist.Barcoderkennung
Umwandlung eines grafischen Barcodes in Zahlen oder Text.Batch-Typ
Schwarz-Weiß-Linienformular
Schwarzes Quadrat
Helligkeit
Ein Schwellenwert für die Lichtempfindlichkeit, der festlegt, ab wann der Scanner Graustufen-Halbtöne als Weiß erkennt.C
Häkchen
Ein maschinell lesbares Formularelement, das beim Ausfüllen eines Formulars mit einer Markierung (Haken, Kreuz, Punkt, ausgefüllt usw.) versehen wird.Häkchenfeld
Häkchengruppe
Ein Element eines maschinenlesbaren Formulars, das mehrere nahe beieinanderliegende Häkchen zusammenfasst. In einer Häkchengruppe können ein oder mehrere Häkchen ausgewählt sein.Häkchengruppenfeld
Ein Feld in einer Document Definition, das eine Häkchengruppe enthält.Klassifikator
Ein in FlexiLayout Studio erstelltes Projekt, das zur vorläufigen Identifizierung von Seiten dient, bevor Dokumentdefinitionen angewendet werden, sowie zur Auswahl des passenden FlexiLayouts oder der passenden Layout-Alternative.F-measure des Klassifikators
Ein kombiniertes Maß für Präzision und Recall bei der Dokumentklassifizierung. Sie wird als Zahl zwischen 0 und 1 oder als Prozentsatz zwischen 0 % und 100 % angegeben. Die F-measure für eine Kategorie wird als (β^2 + 1) * P * R / (β^2 * P + R) berechnet, wobei P die Präzision für die Kategorie ist, R der Recall für die Kategorie und β ein freier Parameter, der die relative Gewichtung von Präzision und Recall für das jeweilige Modell bestimmt. Der Maximalwert = 1 (100 %) bei P = R = 1 (100 %). Die F-measure für einen Test-Batch oder Trainings-Batch wird als (β^2 + 1) * P * R / (β^2 * P + R) berechnet, wobei P die Präzision für den Test-Batch oder Trainings-Batch ist, R der Recall für den Test-Batch oder Trainings-Batch und β ein freier Parameter, der die relative Gewichtung von Präzision und Recall für das jeweilige Modell bestimmt.Codepage
Formular mit farbigem Hintergrund
Kontrast
Verhältnis zwischen der Helligkeit der dunkelsten und der hellsten Bereiche in einem Bild.Steuerelement
Korrigiertes Häkchen
Kreuz
Eine Ankermarke in Form eines Kreuzes.Benutzerdefinierter Datentyp
Benutzerdefinierter Datentyp. (Administrator) Siehe Benutzerdefinierte Datentypen erstellen.D
Datenbankabgleich
Datensatz
Datentyp
Details...
Details...
Eines der Merkmale eines Felds ist der Datentyp: Number, Datum, Text, Nachname, Vorname, Adresse usw. Ein Datentyp definiert, welche Wörter im jeweiligen Feld vorkommen können. Der Datentyp ist ein wichtiger Erkennungsparameter, der sich auf die Erkennungsqualität auswirkt. Ein korrekt festgelegter Datentyp kann die Anzahl falsch erkannter Zeichen erheblich verringern.
Beschreibungsdatei
Eine Hilfsdatei, die definiert, wie ein Batch zusammengestellt wird, wenn Bilder aus einem Hot Folder hinzugefügt werden. (Administrator) Weitere Informationen finden Sie unter Beschreibungsdatei.Dictionary
Details...
Details...
Ein Wörterbuch wird beim Erstellen eines Datentyps festgelegt. Dadurch bestimmt der einem Feld zugeordnete Datentyp, welches Wörterbuch bei der Erkennung und Verifizierung verwendet wird. Zusätzlich zu den vorhandenen vordefinierten Datentypen mit fertigen Wörterbüchern können Sie Feldern auch Datentypen zuordnen, die auf benutzerdefinierten Wörterbüchern basieren. Sie können Wörterbuchdaten manuell eingeben oder aus einer Datei laden.
Dokument
Dokumenten-Batch
Eine vom Benutzer gruppierte Zusammenstellung von Dokumenten. Ein Batch enthält normalerweise den Stapel von Dokumenten, die in einem einzigen Durchgang gescannt oder aus einem bestimmten Ordner importiert wurden. (Administrator) Siehe Dokumenten-Batches.Dokumentenklasse
Dokumentdaten
Daten, die nach der Verarbeitung von Dokumentseitenbildern (Erkennung, Verifizierung und Bearbeitung der Erkennungsergebnisse) erfasst werden.Dokumentdefinition
Eine Dokumentdefinition legt die Prinzipien für die Identifizierung und Verarbeitung eines bestimmten Dokumenttyps fest und enthält:- die Dokumentstruktur, d. h. eine Beschreibung der zulässigen Seitenreihenfolge für Dokumente dieses Typs, die festlegt, wie Dokumente zusammengesetzt werden sollen
- Definitionen von Dokumentabschnitten
- eine Liste von Regeln, die Felddaten erfüllen müssen
- die Positionen von Feldern und ihren Signaturen im Datenfenster (Datenformularansicht)
- Exporteinstellungen für Dokumente
- Einstellungen für die Dokumentverarbeitung
Identifizierung der Dokumentdefinition
Dokumentdefinition Matching
Veröffentlichung einer Dokumentdefinition
Gibt nach der Bearbeitung den Zugriff auf eine neue Version einer Dokumentdefinition frei. Eine veröffentlichte Version nimmt an der Verarbeitung von Dokumenten aus Arbeits-Batches teil, während eine unveröffentlichte lokale Version nur an der Verarbeitung von Dokumentdefinitionen aus Test-Batches teilnehmen kann. (Administrator) Siehe Bearbeiten und Veröffentlichen einer Dokumentdefinition.Abschnitt einer Dokumentdefinition
Dokumentidentifikation
Dokumentensatz
Dokumenttext
Dokumenttyp
Dokumentvariante
Nadeldrucker
Eine Art von erkennbarem Text, die einen Text bezeichnet, der mit einem Nadeldrucker gedruckt wurde.dpi
E
Entität
Umgebungsvariable
Fehler / Warnung
Ein Fehler bzw. eine Warnung tritt auf, wenn aus einem oder mehreren Feldern extrahierte Daten die bei automatischen Prüfungen angewendeten Regeln nicht erfüllen oder nicht dem angegebenen Format entsprechen. Es gibt zwei verschiedene Arten von Fehlern und Warnungen:- Einzelfeldfehler / -warnungen werden durch Regeln und Formate erzeugt, die sich auf ein Feld beziehen;
- Mehrfeldfehler / -warnungen werden durch Regeln erzeugt, die sich auf mehrere Felder beziehen.
Erläuterungstext
Ein maschinenlesbares Formularelement, das einen beschreibenden Text enthält (Formularname, Feldnamen, Erläuterungen zu Feldern usw.).Export
Übertragung verarbeiteter Daten an ein externes Informationssystem oder in eine Datei.Exportprofil
Eine Konfiguration von Einstellungen, die bestimmt, was mit verarbeiteten Daten geschieht: das Format der Ausgabedateien, der Ausgabepfad, Exportbedingungen usw.Externe Datenbank
F
Feld
Ein Dokumentelement zur Datenextraktion. Felder können einfach (ohne interne Struktur) oder zusammengesetzt sein, etwa ein Tabellenfeld, bei dem jede Zelle als separates untergeordnetes Feld der Tabelle betrachtet werden kann. (Administrator) Siehe Erstellen von Dokumentdefinition-Feldern.Feldregion
Feldverifizierung
Details...
Details...
Im Modus der Feldverifizierung werden unsichere Zeichen im Kontext des gesamten Feldes geprüft. Felder, für die die Option An die Feldverifizierung senden aktiviert ist, werden zur Feldverifizierung weitergeleitet. Wir empfehlen, Felder zur Feldverifizierung weiterzuleiten, deren Wertebereich bekannt ist oder sich leicht bestimmen lässt. Beispiele für solche Felder sind Länder- oder Städtenamen: Wir wissen, welche Werte dieses Feld annehmen kann.
Feld mit mehreren Instanzen
Feld mit mehreren Regionen
Feld ohne Region
Ein in einer Dokumentdefinition erkanntes Feld, das jedoch keine Region auf dem Bild hat. (Administrator) Siehe Felder ohne Region.Festes Formular
Ein Dokument mit festen Informationsfeldern, deren Formatierung, Anzahl und Layout strikt definiert sind und sich von einer Dokumentinstanz zur nächsten nicht ändern.Feste Dokumentdefinition
Eine Definition eines Dokuments oder eines seiner Abschnitte, die für die Verarbeitung fester Formulare ausgelegt ist. Felder in einer festen Dokumentdefinition haben feste Positionen.FlexiLayout
Beschreibung der Struktur eines semistrukturierten Dokuments. Diese Beschreibung wird in ABBYY FlexiLayout Studio erstellt und in ABBYY FlexiCapture exportiert. Dateiformat *.afl. FlexiLayout ist eine Art Anweisung zur Erkennung und Identifizierung von Feldern in einem flexiblen Formular.FlexiLayout-Variante
Flexible Dokumentdefinition
Eine Definition eines Dokuments oder eines seiner Abschnitte, die für die Verarbeitung semistrukturierter Dokumente konzipiert ist. Erstellt durch Anhängen eines FlexiLayout. Felder in einer solchen Dokumentdefinition haben keine festen Positionen. Sie werden mithilfe eines FlexiLayouts erkannt. (Administrator) Siehe Erstellen einer Dokumentdefinition für die Verarbeitung semistrukturierter Dokumente.Formular
Ein Dokument, das aus einer oder mehreren Seiten besteht und dazu bestimmt ist, von einer Person von Hand oder mithilfe eines anderen Druckverfahrens ausgefüllt zu werden.Text im Rahmen
Art der Textmarkierung, bei der ein Rahmen den Text umgibt.Anzeigen...
Anzeigen...

Gerahmter Text über einem Kamm
Anzeigen...
Anzeigen...

G
Formular mit grauem Hintergrund
Gruppenverifizierung
Details...
Details...
Felder, für die die Option An die Gruppenverifizierung senden aktiviert ist, werden zur Gruppenverifizierung gesendet. Wir empfehlen, Zeichen in Zahlenfeldern sowie Häkchen zur Gruppenverifizierung zu senden.
H
Handgeschriebene Druckschrift
Eine Art von erkennbarem Text, der von Hand in deutlicher Druckschrift geschrieben ist.Handschriftlicher Text
Eine Art von Text, dessen Buchstaben ganz oder teilweise miteinander verbunden sind. Hinweis: Derzeit kann nur englischer handschriftlicher Text erkannt werden.Hotfolder
Ein Ordner auf der Festplatte eines lokalen oder entfernten Computers, der zum Importieren von Bildern verwendet wird. Er wird normalerweise für den regelmäßigen, wiederkehrenden Upload von Bildern ohne Zutun des Benutzers verwendet. (Administrator) Siehe Bildimportprofile.I
Bezeichner
Ein statisches Element, das zur Identifizierung einer Dokumentdefinition aus mehreren Dokumentdefinitionen mit identischen Positionen von Ankern verwendet wird. Die Option Use for Document Definition identification muss in den Eigenschaften solcher statischen Elemente aktiviert werden.Identitätsanbieter
Ein Drittsystem wie Azure AD, OneLogin oder Okta, das Identitätsinformationen verwaltet und seinen Clients Authentifizierungsdienste bereitstellt, sodass ein Endbenutzer durch die einmalige Eingabe seiner Zugangsdaten auf alle autorisierten Ressourcen in seinem lokalen Netzwerk zugreifen kann.Ignoriertes Zeichen
Details...
Details...
Diese Zeichen werden bei Wörtern ausgeschlossen, d. h., die Wörter werden auch ohne diese Zeichen einem bestimmten Datentyp zugeordnet.
Image
Das elektronische Abbild einer gescannten Seite eines Papierdokuments.Entfernung von Störpunkten
Entfernung von Rauschen aus dem Bild. Rauschen kann beim Scannen entstehen; daher wird empfohlen, es zu entfernen, um die Datenerkennung zu verbessern. Bei der Entfernung von Störpunkten entfernt das Programm auch Hintergrundpunkte oder Begrenzungslinien in Rasterformularen.Bildimport
Das Hinzufügen von Bildern zu einem Batch zur Verarbeitung. Der Import kann durch das Hinzufügen von Bildern aus Dateien, von einem Scanner oder mithilfe von Importprofilen erfolgen. (Administrator, Verifizierung) Siehe Hinzufügen von Seitenbildern.Bilddrehung
Drehung eines Bildes um seinen Mittelpunkt.Importprofil
Eine Kombination aus Einstellungen, mit der Bilder zu einem Batch hinzugefügt werden: Importquelle, Optionen für die Bildverarbeitung, Optionen zum Bereinigen des Hot Folder usw. (Administrator) Siehe Bildimportprofile.Fehlerhaft erkanntes Zeichen
Status, der einem Zeichen während der Erkennung automatisch zugewiesen wird, wenn es mit erheblicher Unsicherheit erkannt wurde.Indexfeld
Ein Feld, dessen Wert zur Indizierung von Dokumenten für Sortier- und Suchzwecke verwendet wird. (Administrator) Siehe Indexfelder.Invertiertes Bild
Rechnung
ICR, intelligente Zeichenerkennung
K
Schlüsselfeld
Ein Feld, das die automatische Prüfung der Seitenzusammenstellung zu Dokumenten ermöglicht. Die Werte von Schlüsselfeldern müssen auf allen Seiten desselben Dokuments identisch sein.L
Sprache (lokal)
Eine Feldeigenschaft, die die Schreibsprache und die zugehörigen Sätze regionaler Parameter festlegt (z. B. die Schreibweise von Datumsangaben oder Adressen).Layout
Eingerahmte Buchstaben
Anzeigen...
Anzeigen...

Buchstaben in einzelnen Rahmen
Anzeigen...
Anzeigen...

Buchstaben über einem Kamm
Anzeigen...
Anzeigen...

M
Maschinell gedruckter Text
Eine Art von Text, der mit typografischen Geräten oder einem Laser- oder Tintenstrahldrucker mit einer Mindestauflösung von 300 dpi gedruckt wurde.Maschinenlesbares Formular
Feld für die manuelle Eingabe
Ein Feld in einer Dokumentdefinition, das nicht erkennbaren Text enthält (zum Beispiel Text aus verschmolzenen Buchstaben), der über die Tastatur eingegeben werden muss.MRC (Mixed Raster Content)
Eine Komprimierungsmethode für Bilder, die sowohl Text als auch Rasterfragmente enthalten. Das Bild wird in Fragmente zerlegt, und für jedes Fragment wird ein optimaler Komprimierungsalgorithmus ausgewählt. Dieser Ansatz ermöglicht bessere Komprimierungsraten bei gleichbleibender visueller Bildqualität.Nichtproportionaler Text
Art der Textmarkierung, bei der sich jeder Buchstabe innerhalb eines Rahmens gleicher Höhe und Breite befindet, dessen Rand beim Scannen jedoch verschwindet.Mehrseitiges Dokument
Ein Dokument mit mehreren Seiten.Mehrmandantenfähigkeit
N
NER (Named-Entity Recognition) Eine Informationsextraktionsaufgabe, bei der in unstrukturiertem Text nach Attributen gesucht und diese in vordefinierte Kategorien klassifiziert werden. NLP (Natural Language Processing) Ein Teilgebiet der künstlichen Intelligenz und der mathematischen Linguistik. Es befasst sich mit der computergestützten Analyse und Synthese natürlicher Sprachen. Eine mögliche Anwendung ist die Extraktion aussagekräftiger Informationen aus Text. Dazu gehören unter anderem maschinelle Übersetzung, Chatbots, Klassifizierung, Tonalitätsanalyse, Datenextraktion usw.NLP-Modell
O
OCR (Optical Character Recognition)
OMR (Optische Markierungserkennung)
Operator
Operator-Rolle
Überlagerung
P
Seite
Abbildung einer Papierdokumentseite und der Verarbeitungsergebnisse.Seitenlayout
Eine schematische Darstellung der Position der Felder auf einem Bild.Seitenorientierung
Ausrichtung der Seite relativ zur Standardausrichtung: von oben nach unten, von links nach rechts. Die Seitenorientierung kann bei der Erkennung des Seitenbilds automatisch bestimmt werden. Dazu können Sie in ABBYY FlexiCapture mögliche Orientierungen angeben.Bild
Ein Element eines maschinenlesbaren Formulars, das nicht erkannt wird, sondern zum Export als grafisches Objekt bestimmt ist (zum Beispiel als Datei).Bildfeld
Ein Feld einer Document Definition, das ein Bild enthält. Präzision Eine Kennzahl, mit der der Benutzer die Qualität der automatischen Klassifizierung bewerten kann. Sie wird berechnet, indem die Anzahl der korrekt als Klasse A identifizierten Dokumente durch die Gesamtzahl aller als Klasse A identifizierten Dokumente geteilt wird (sowohl der korrekt als auch der inkorrekt identifizierten).Vorerkennung
Verarbeitungsleistung
(Distributed) Verarbeitungsstufe
Verbotenes Zeichen
Details...
Details...
Die Angabe solcher Zeichen kann die Geschwindigkeit und Qualität der Erkennung erheblich verbessern. Wenn Sie beispielsweise Texte erkennen, die nur Großbuchstaben enthalten, geben Sie alle Kleinbuchstaben als verbotene Zeichen an.
Projekt
Ein Projekt ist eine eigenständige Umgebung, in der die für die Verarbeitung erforderlichen Dokument-Batches und Einstellungen zusammengefasst sind, z. B. Dokumentdefinitionen, Importprofile usw. (Administrator) Siehe Erstellen eines Projekts.(Distributed) Q
(Distributed) Warteschlange
R
Rasterformular
Rasterlinie
Eine Linie aus gleichmäßig angeordneten Punkten. Recall Eine Kennzahl, mit der Benutzer die Qualität der automatischen Klassifizierung bewerten können. Sie wird berechnet, indem die Anzahl der korrekt identifizierten Dokumente der Klasse A durch die Gesamtzahl aller Dokumente der Klasse A geteilt wird.Erkennung
Ein Prozess, bei dem Bildelemente mit bestimmten Zeichen abgeglichen werden.Erkennungssprache
Referenzlayout
Ein benutzerdefiniertes Layout, das als Referenz für automatisch erstellte Layouts dient. Anhand dieses Vergleichs wird bewertet, wie gut das Programm Feldregionen erkennt.(Administrator) Regulärer Ausdruck
(Administrator) Beschreibung der Struktur eines Wortes oder eines beliebigen eingegebenen Werts mithilfe einer speziellen Sprache. Das Programm ermöglicht es Ihnen, nicht nur die zulässigen Zeichen, sondern auch die Struktur von Feldinhalten anzugeben. Sie können die Struktur mit einem regulären Ausdruck beschreiben, wenn Sie Einschränkungen für ein Textfeld festlegen oder einen benutzerdefinierten Datentyp erstellen. Siehe Alphabet in regulären Ausdrücken.Auflösung
Image-Parameter. Die Auflösung wird in dpi (Dots per Inch) gemessen. Ergebnisklassen Eine Ergebnisklasse ist eine Klasse, die einem Dokument bei der automatischen Klassifizierung zugewiesen wurde.Regelprüfung
Eine automatische Prüfung erkannter Daten anhand vordefinierter Regeln. Siehe Regelprüfung.Regeln
Bestimmte Bedingungen, die für Daten in Feldern gelten und vom Programm automatisch geprüft werden. (Administrator, Verifizierung) Siehe Regelprüfung.S
Scannen
Der Vorgang, bei dem mithilfe eines Scanners ein elektronisches Bild eines Papierformulars erstellt wird. Segment Ein Textfragment, das aus einem oder mehreren Absätzen besteht und Daten enthält, die extrahiert werden müssen. Ein Segment kann auch ein Feld sein, das extrahiert werden muss (zum Beispiel Bedingungen für die Beendigung eines Vertrags). Segmentation Der Prozess der Identifizierung von Segmenten. Die Segmentierung geht der Informationsextraktion voraus und ist besonders bei großen Dokumenten nützlich, da sie die Suche nach Entitäten auf bestimmte Textfragmente eingrenzt.Abschnitt
Ein logisch abgegrenzter Teil eines Dokuments, der eine Reihe extrahierbarer Felder enthält. Abschnitte werden während des Erkennungsprozesses für verschiedene Zwecke verwendet, etwa zum Zusammenstellen von Dokumenten aus Seiten. Abschnitte können eine einzelne Seite oder mehrere Seiten umfassen und fest oder flexibel sein. (Administrator) Siehe Erstellen von Dokumentdefinitionen für mehrseitige Dokumente.Semi-strukturiertes Dokument
Dokument mit einer Reihe von Informationsfeldern, deren Gestaltung, Anzahl und Layout je nach Dokumentinstanz erheblich variieren können. Siehe Welche Dokumenttypen sich mit ABBYY FlexiCapture verarbeiten lassen.Trennlinie
Ein maschinenlesbares Formularelement, das eine vertikale oder horizontale Linie darstellt.Servicefeld
Satz zulässiger Zeichen
Details...
Details...
Dieser Satz wird durch den Datentyp bestimmt. Das heißt: Die Art der Daten, die einem Feld zugewiesen sind, bestimmt den Zeichensatz, der bei der Erkennung verwendet wird.Sie können nicht nur die in diesem Satz enthaltenen Zeichen auswählen, sondern auch zusätzliche Parameter konfigurieren, die diesen Satz weiter einschränken. Sie können beispielsweise Folgendes festlegen:
- Zeichen, von denen Sie wissen, dass sie bei der Erkennung eines bestimmten Felds nicht vorkommen, als verbotene Zeichen (zum Beispiel können Sie alle Kleinbuchstaben für ein Feld als verboten festlegen, wenn dort nur Großbuchstaben vorkommen dürfen).
- Zeichen, die innerhalb von Wörtern vorkommen können, ohne deren Verifizierung zu beeinflussen, als ignorierte Zeichen (zum Beispiel Bindestriche, Betonungszeichen usw.).
Einfacher Text
Eine Art der Textmarkierung, bei der Text ohne Trennzeichen in einen Block eingefügt wird.Dateneingabe in einem einzigen Flow
Automatisierte Datenextraktion aus analogen (gedruckten) und digitalen (gescannten Bilddokumenten) Dokumenten.Dokumenteneingabe in einem einzelnen Workflow
Automatische Umwandlung von Papierdokumenten in elektronische Form.SLA (Service Level Agreement)
Statische Elemente
Nicht erkennbare Elemente, die für das Matching und die Identifizierung in der Dokumentdefinition vorgesehen sind. Solche Elemente sind: Anker, Ankertext, Trennlinien, Anker-Barcodes.Abschnitt „Zusammenfassung“
T
Tabelle
Tabellenfeld
(Distributed) Aufgabe
Tenant
Test-Batches
Dokumenten-Batches, die für das Testen und die Konfiguration von Dokumentdefinition vorgesehen sind. Zur Verarbeitung von Test-Batches werden lokale Kopien von Dokumenten-Batches verwendet. (Administrator) Siehe Dokumenten-Batches.Textfeld
Textfeldmarkierung
Textmarkierung
Die Gestaltung einer Seitenregion für die Texteingabe. (Administrator) Siehe Beispiele für Textformatierungen im Thema Eingabefeld.Textausrichtung
Ausrichtung des Textes in einem Feld relativ zur Seite.Texterkennung (OCR, ICR)
Umwandlung eines Bildes in Text.Textprobe
Training [Dokumentdefinition]
Trainings-Batches
Schreibmaschinenschrift
Eine Art von erkennbarem Text, der mit einer Schreibmaschine gedruckten Text darstellt.U
Unterstrichener Text
Anzeigen...
Anzeigen...

Benutzerwörterbuch
Ein vom Benutzer erstelltes zusätzliches Wörterbuch, das Wörter enthält, die nicht in den integrierten Wörterbüchern enthalten sind. Integrierte Wörterbücher können durch ein Benutzerwörterbuch ergänzt werden, um die Qualität der Datenerfassung zu verbessern. Ein Benutzerwörterbuch enthält in der Regel Fachbegriffe, Abkürzungen, Firmennamen usw.Nicht erkennbare Region
Eine Bildregion, die von der Erkennung ausgeschlossen ist. Eine nicht erkennbare Region wird benötigt, um eine Region mit erläuterndem Text oder Bild auszuschließen, die die Felderkennung erschwert. (Administrator) Siehe Eine Region von der Erkennung ausschließen.Unstrukturiertes Dokument
Ein Dokument, dessen Informationen in freier Form dargestellt sind. Beispiele für solche Dokumente sind Verträge, Briefe, Bestellungen und Grafiken. (Administrator) Siehe Erstellen von Dokumentdefinitionen für unstrukturierte und semi-strukturierte Dokumente.V
Vendor
Verifizierung
Bei der Verifizierung wird geprüft, ob die Daten erkannt wurden, die Seiten korrekt zu Dokumenten zusammengestellt wurden und die Regeln keine Fehler ergeben haben. (Standalone) Die Verifizierung wird auf der Operator Station durchgeführt. (Distributed) Die Verifizierung wird auf der Data Verification Station (wo die Erkennungsgenauigkeit verifiziert wird) und auf der Verifizierungsstation (wo alle Arten von Prüfungen durchgeführt werden können) durchgeführt. (Administrator, Verification) Siehe Verifizierung.W
Arbeitsbatches
Dokumenten-Batches für die Dateneingabe. Für die Verarbeitung von Arbeitsbatches werden nur veröffentlichte Dokumentdefinitionen verwendet. (Administrator) Siehe Dokumenten-Batches.Schriftstil
Details...
Details...
Diese Option dient zum Konfigurieren des Schriftstils handschriftlicher Druckbuchstaben in Formularen. Die Wahl des Schriftstils hängt von der Region ab, in der die Formularverarbeitung erfolgt (Russland, Deutschland, die Tschechische Republik, die USA usw.).
