- Überblick
- Verträge zur Dokumentverarbeitung
- Versionshinweise
- Über die DocumentProcessing-Verträge
- Box-Klasse
- IPersistedActivity-Schnittstelle
- PrettyBoxConverter-Klasse
- IClassifierActivity-Schnittstelle
- IClassifierCapabilitiesProvider-Schnittstelle
- ClassifierDocumentType-Klasse
- ClassifierResult-Klasse
- ClassifierCodeActivity-Klasse
- ClassifierNativeActivity-Klasse
- ClassifierAsyncCodeActivity-Klasse
- ClassifierDocumentTypeCapability-Klasse
- ExtractorAsyncCodeActivity-Klasse
- ExtractorCodeActivity-Klasse
- ExtractorDocumentType-Klasse
- ExtractorDocumentTypeCapabilities-Klasse
- ExtractorFieldCapability-Klasse
- ExtractorNativeActivity-Klasse
- ExtractorResult-Klasse
- ICapabilitiesProvider-Schnittstelle
- IExtractorActivity-Schnittstelle
- ExtractorPayload-Klasse
- DocumentActionPriority-Enumeration
- DocumentActionData-Klasse
- DocumentActionStatus-Enumeration
- DocumentActionType-Enumeration
- DocumentClassificationActionData-Klasse
- DocumentValidationActionData-Klasse
- UserData-Klasse
- Document-Klasse
- DocumentSplittingResult-Klasse
- DomExtensions-Klasse
- Page-Klasse
- PageSection-Klasse
- Polygon-Klasse
- PolygonConverter-Klasse
- Metadatenklasse
- WordGroup-Klasse
- Word-Klasse
- ProcessingSource-Enumeration
- ResultsTableCell-Klasse
- ResultsTableValue-Klasse
- ResultsTableColumnInfo-Klasse
- ResultsTable-Klasse
- Rotation-Enumeration
- SectionType-Enumeration
- WordGroupType-Enumeration
- IDocumentTextProjection-Schnittstelle
- ClassificationResult-Klasse
- ExtractionResult-Klasse
- ResultsDocument-Klasse
- ResultsDocumentBounds-Klasse
- ResultsDataPoint-Klasse
- ResultsValue-Klasse
- ResultsContentReference-Klasse
- ResultsValueTokens-Klasse
- ResultsDerivedField-Klasse
- ResultsDataSource-Enumeration
- ResultConstants-Klasse
- SimpleFieldValue-Klasse
- TableFieldValue-Klasse
- DocumentGroup-Klasse
- DocumentTaxonomy-Klasse
- DocumentType-Klasse
- Field-Klasse
- FieldType-Enumeration
- LanguageInfo-Klasse
- MetadataEntry-Klasse
- TextType-Aufzählung
- TypeField-Klasse
- ITrackingActivity-Schnittstelle
- ITrainableActivity-Schnittstelle
- ITrainableClassifierActivity-Schnittstelle
- ITrainableExtractorActivity-Schnittstelle
- TrainableClassifierAsyncCodeActivity-Klasse
- TrainableClassifierCodeActivity-Klasse
- TrainableClassifierNativeActivity-Klasse
- TrainableExtractorAsyncCodeActivity-Klasse
- TrainableExtractorCodeActivity-Klasse
- TrainableExtractorNativeActivity-Klasse
- Document Understanding Digitizer
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Versionshinweise
- Über das Document Understanding-Aktivitätspaket
- Projektkompatibilität
- PDF-Passwort festlegen
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- PDF-Seitenbereich extrahieren
- Extract Document Data
- Validierungsaufgabe erstellen und warten
- Wait for Validation Task and Resume
- Create Validation Task
- Dokument klassifizieren (Classify Document)
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Wait For Classification Validation Task And Resume
- IntelligentOCR
- Versionshinweise
- Über das IntelligentOCR-Aktivitätspaket
- Projektkompatibilität
- Konfigurieren der Authentifizierung
- Taxonomie laden (Load Taxonomy)
- Digitalisieren von Dokumenten
- Dokumentbereich klassifizieren (Classify Document Scope)
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Document Understanding-Projektklassifizierer
- Intelligenter Schlüsselwortklassifizierer
- Create Document Validation Action
- Wait For Document Classification Action And Resume
- Klassifizierer-Scope trainieren
- Keyword Based Classifier Trainer
- Intelligent Keyword Classifier Trainer
- Datenextraktionsumfang
- Document Understanding-Projektextraktor
- Regex Based Extractor
- Form Extractor
- Extraktor für intelligente Formulare
- Aktuelle Validierungsstation
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Train Extractors Scope
- Extraktionsergebnisse exportieren
- ML-Services
- OCR
- OCR-Verträge
- Versionshinweise
- Über die OCR-Verträge
- Projektkompatibilität
- IOCRActivity-Schnittstelle
- OCRAsyncCodeActivity-Klasse
- OCRCodeActivity-Klasse
- OCRNativeActivity-Klasse
- Character-Klasse
- OCRResult-Klasse
- Word-Klasse
- FontStyles-Enumeration
- OCRRotation-Enumeration
- OCRCapabilities-Klasse
- OCRScrapeBase-Klasse
- OCRScrapeFactory-Klasse
- ScrapeControlBase-Klasse
- ScrapeEngineUsages-Enumeration
- ScrapeEngineBase
- ScrapeEngineFactory-Klasse
- ScrapeEngineProvider-Klasse
- OmniPage
- PDF
- [Nicht aufgeführt] Abbyy
- Versionshinweise
- Über das Abbyy-Aktivitätspaket
- Projektkompatibilität
- Abbyy OCR
- Abbyy Cloud OCR
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Dokument klassifizieren (Classify Document)
- Dokument verarbeiten (Process Document)
- Dokument validieren (Validate Document)
- Dokument exportieren (Export Document)
- Feld erhalten (Get Field)
- Tabelle erhalten (Get Table)
- Vorbereiten der Validierungsstationsdaten
- [Nicht aufgeführt] Abbyy Embedded
Form Extractor
UiPath.IntelligentOCR.Activities.DataExtraction.FormExtractor
Der Form Extractor eignet sich am besten zum Extrahieren, Abgleichen und Melden bestimmter Informationen, indem er die Position des Wortes im Dokument analysiert oder eine Signatur erkennt. Diese Aktivität kann nur zusammen mit der Aktivität Data Extraction Scope verwendet werden. Handgeschriebener Text kann auch erkannt werden, wenn die Form Extractor -Aktivität zusammen mit der UiPath Document OCR- Aktivität verwendet wird.
Eigenschaften-Panel
Allgemein
- AnzeigeName (DisplayName) - Der Anzeigename der Aktivität.
Eingabe
- ApiKey – Gibt den API-Schlüssel des Kontos an. Das Feld API-Schlüssel wird automatisch vorab ausgefüllt, wenn es in den lokalen Projekteinstellungen oder im Document Understanding-Framework definiert ist.
- Endpunkt – Die URL zum UiPath®-Server. Standardmäßig ist der Endpunkt
https://du.uipath.com/svc/formextractor
. Weitere Informationen finden Sie unter Document Understanding – Öffentliche Endpunkte. - MinOverlapPercentage – Gibt den minimalen Überlappungsbereich (in Prozent) zwischen einem Rahmen im Dokument und einem Rahmen in der Vorlage an, der für eine Extraktion erforderlich ist. Der Prozentwert kann zwischen
0
und100
festgelegt werden. Der Standardwert ist65
. - Zeitüberschreitung - Gibt die Zeitspanne (in Millisekunden) an, in der auf eine Antwort vom Server gewartet wird, bevor ein Fehler ausgelöst wird. Der Standardwert ist 100.000 Millisekunden (100 Sekunden).
Sonstiges
- Privat (Private) - Bei Auswahl werden die Werte von Variablen und Argumenten nicht mehr auf der Stufe Verbose protokolliert.
Hinweis: Für einen Dokumenttypkönnen mehrere Vorlagen definiert werden. Wenn die Aktivität ausgeführt wird, wählt der Extraktor die am besten passende Vorlage basierend auf den Informationen auf der ersten Seite aus.
Damit können Sie Vorlagen für die in der Taxonomie definierten Dokumenttypen erstellen, bearbeiten, verwalten und exportieren/importieren.
Erstellen einer Vorlage
- Fügen Sie eine Form Extractor-Aktivität zu Ihrem Workflow in einer Data Extraction Scope-Aktivität hinzu.
- Konfigurieren Sie den Extraktor, indem Sie Vorlagen verwalten auswählen.
Das Fenster Vorlagenmanager wird geöffnet.Abbildung 1. Übersicht über den Vorlagenmanager-Assistenten
- Klicken Sie auf die Schaltfläche Vorlage erstellen zum Erstellen einer neuen Vorlage.
Abbildung 2. Übersicht über die Konfigurationsfelder Neue Vorlage erstellen
Hinweis:Wenn das UiPath.IntelligentOCR.Activities-Paket auf v5.1.0 aktualisiert wurde, dann wurde der Parameter ForceApplyOCR durch ApplyOcrOnPDF ersetzt. Hier ist die Kompatibilität zwischen den alten und neuen Parametern:
- ForceApplyOCR = True wird ersetzt durch ApplyOcrOnPDF = Yes
- ForceApplyOCR = False wird ersetzt durch ApplyOcrOnPDF = Auto
- ForceApplyOCR = Empty wird ersetzt durch ApplyOcrOnPDF = Auto
- ForceApplyOCR =
<user-defined variable>
wird ersetzt durch ApplyOcrOnPDF = Auto
Die Option OCR auf PDF anwenden legt fest, ob der OCR-Prozess auf PDF-Dokumente angewendet werden soll oder nicht. In der Dropdownliste sind drei Optionen verfügbar: True, Falseund Auto.
Bei True wird die OCR auf allen PDF-Seiten des Dokuments angewendet. Wenn auf False festgelegt, wird nur digital eingegebener Text extrahiert. Bei dem Standardwert Automatisch wird ermittelt, ob das Dokument abhängig vom Eingabedokument den OCR-Algorithmus anwenden muss.
Jedes OCR-Modul verfügt über eine eigene Reihe benutzerdefinierter Optionen. Weitere Informationen zu allen Optionen, die für jedes OCR -Modul verfügbar sind, finden Sie unter OCR-Modul. Das standardmäßige OCR-Modul ist UiPath Document OCR.
- Wählen Sie den Dokumenttyp für Ihre Vorlage aus der Dropdownliste Dokumenttyp aus.
Hinweis: Alle Dokumenttypen basieren auf der Taxonomie. Stellen Sie sicher, dass Sie eine Taxonomie im Projektordner hinzugefügt oder erstellt haben.
- Fügen Sie den Namen der Vorlage im Feld Vorlagenname hinzu. Wählen Sie einen passenden Namen für die Version oder das Layout Ihres Dokuments.
- Fügen Sie den Pfad des Dokuments im Feld Vorlagendokument hinzu.
Navigieren Sie mit der Option Durchsuchen zum Pfad der Datei.
- Wählen Sie ein OCR-Modul von der Dropdownliste OCR-Modul aus und konfigurieren Sie es gemäß den Anforderungen.
- Wählen Sie Konfigurieren, um die Vorlagenbearbeitung auszulösen.
Wenn Sie bereits eine Vorlage erstellt haben, kann sie bearbeitet, exportiert oder entfernt werden. Die Optionen Löschen und Exportieren sind nur verfügbar, wenn mindestens eine Vorlage ausgewählt ist. Die Optionen Bearbeiten und Entfernen für eine einzelne Vorlage sind immer verfügbar.
Boolean
-Inhaltsinterpretation verwendet, bei der ein erfasster Wert einem gemeldeten Wert Yes (Ja) oder No (Nein) zugeordnet wird.
Sie können Vorlagen importieren, die von anderen Workflows erstellt und exportiert wurden. Verwenden Sie diese Funktionen, um Vorlagen zwischen Projekten freizugeben. Sobald ein Dokumenttyp mit dem Intelligent Form Extractor konfiguriert wurde, müssen Sie die Vorlagen in einer neuen Implementierung nicht noch einmal konfigurieren.
Exportvorgang
Dies sind die Schritte, die Sie ausführen müssen, um eine Vorlage zu exportieren:
- Erstellen Sie eine oder mehrere Vorlagen, indem Sie die am Anfang dieser Seite erläuterten Schritte ausführen.
- Wählen Sie die Vorlagen aus, die Sie exportieren möchten.
- Wählen Sie eine Export-Option aus:
- Export mit ursprünglichen Dateien
Beim Exportieren mit Originaldateien werden sie an den Export angehängt.
- Export ohne ursprüngliche DateienAbbildung 5. Die Aktion zur Auswahl der Optionen Mit ursprünglichen Dateien exportieren
- Export mit ursprünglichen Dateien
- Speichern Sie das Archiv der Vorlage mit dem gewünschten Namen.
- Nach dem Speichern der Vorlage wird eine Meldung angezeigt. Wählen Sie OK aus.
Abbildung 6. Die Meldung „X“ wurde erfolgreich exportiert
Hinweis:Wenn Sie den Inhalt der Dokumente, auf denen Sie Ihre Vorlagen erstellt haben, nicht freigeben können, verwenden Sie die Option Ohne ursprüngliche Dateien exportieren. Sie können das Vorlagenarchiv weiterhin freigeben und in andere Projekte importieren, sie jedoch nicht mehr bearbeiten oder anzeigen.
Wenn Sie die Vorlagen bearbeiten möchten, sobald sie in ein anderes Projekt importiert wurden, verwenden Sie beim Exportieren und Importieren die Option Mit ursprünglichen Dateien exportieren.
Importvorgang
Hier sind die Schritte, die Sie ausführen müssen, um eine Vorlage zu importieren:
- Wählen Sie Importieren aus.
Abbildung 7. Die Aktion zur Auswahl von „ Import“ im Vorlagenmanager -Assistenten
- Wählen Sie ein Archiv aus. Der Importassistent wird angezeigt und zeigt alle Dokumenttypen und alle Vorlagen an, die im ausgewählten Exportarchiv verfügbar sind. Wählen Sie die Vorlagen aus, die Sie importieren möchten, und wählen Sie die gewünschte Import- Option aus:
- Mit ursprünglichen Dateien importieren
- Ohne ursprüngliche Dateien importierenAbbildung 8. Die Importoptionen im Vorlagenmanager- Assistenten
Hinweis:- Beim Importieren von Vorlagen werden Dokumenttypen automatisch in der Taxonomie des Projekts erstellt. Wenn bereits ein Dokumenttyp mit demselben Namen vorhanden ist, wird ein weiterer durch Anhängen einer Zahl an den Dokumenttypnamen erstellt.
- Wenn Sie Vorlagen importieren, die ohne die ursprünglichen Dateien exportiert wurden, oder wenn Sie Vorlagen ohne die ursprünglichen Dateien importieren, gibt es dafür keine Anzeige- oder Bearbeitungsoptionen.
Beim Importieren einer Vorlage können mehrere spezielle Situationen auftreten. In der folgenden Liste werden jede Situation und ihre Besonderheiten beschrieben:
- Neuer Dokumenttyp: Wenn ein neuer Dokumenttyp importiert wird, wird im Assistentenkonfigurator ein neues Feld hinzugefügt, das Sie darüber informiert, dass eine neue Vorlage erstellt werden soll.
- Doppelter Dokumenttyp: Wenn ein identischer Dokumenttyp importiert wird, wird die folgende Warnmeldung angezeigt: „Diese Vorlage ist bereits vorhanden und wird überschrieben.“
- Erweiterte Vorlage: Wenn eine Dokumenttypvorlage importiert wird, die zusätzliche Felder im Vergleich zur bereits vorhandenen enthält, wird die folgende Warnmeldung angezeigt: „Dieser Dokumenttyp wird wie folgt aktualisiert: Das/die folgenden Feld(er) sind nicht vorhanden und werden erstellt.“
- Erweiterter Dokumenttyp: Wenn der Benutzer einen Dokumenttyp importiert, der neben den bereits vorhandenen zusätzliche Felder enthält, wird die folgende Warnmeldung angezeigt: „Dieser Dokumenttyp wird wie folgt angepasst: Die folgenden Felder haben keine Konfigurationen zum Importieren.“
- Dokumenttyp mit identischem Namen, aber unterschiedlichem Inhalt: Wenn der importierte Dokumenttyp denselben Namen, aber verschiedene Felder hat wie der vorhandene, wird die folgende Warnmeldung angezeigt: „Dieser Dokumenttyp wird wie folgt aktualisiert:“
- „Die folgenden Felder sind nicht vorhanden und werden erstellt“
- „Die folgenden Felder haben keine zu importierenden Konfigurationen“
- Dokumenttyp mit fehlender Tabelle: Wenn der importierte Dokumenttyp neben den bereits vorhandenen zusätzliche Felder enthält, wird die folgende Warnmeldung angezeigt: „Dieser Dokumenttyp wird wie folgt angepasst: Die folgenden Felder haben keine Import-Konfigurationen.“
- Dokumenttyp mit erweiterter Tabelle: Wenn der Benutzer einen Dokumenttyp importiert, der eine Tabelle mit zusätzlichen Spalten enthält, wird die folgende Warnmeldung angezeigt: „Dieses Dokument wird wie folgt aktualisiert: Die folgenden Felder sind nicht vorhanden und werden erstellt “.
- Dokumenttyp mit reduzierter Tabelle: Wenn der Benutzer einen Dokumenttyp importiert, der eine Tabelle mit fehlenden Spalten enthält, wird die folgende Warnmeldung angezeigt: „Dieses Dokument wird wie folgt aktualisiert: Die folgenden Felder haben keine Import-Konfigurationen “
- Tabellenvorlage mit unterschiedlichen Dokumenttypen: Wenn Sie eine Dokumenttypvorlage importieren, die eine Tabelle mit unterschiedlichen Dokumenttypen enthält, wird eine neue Vorlage erstellt. Wenn Ihre Taxonomie eine Tabelle mit einem Feld mit einem anderen Dokumenttyp enthält, wird folgende Meldung angezeigt: „Das Feld mit id
xyz
wurde sowohl in der importierten Taxonomie als auch in der vorhandenen Taxonomie gefunden, aber ihre Typen sind entweder nicht kompatibel beide müssen Tabellen sein, oder keines von ihnen).“
Allgemeine Überlegungen
Der Vorlageneditor baut auf die Funktionalität der Validation Station auf. Um darauf zuzugreifen, wählen Sie Bearbeiten aus für eine Vorlage.
Unter Validation Station erfahren Sie mehr über die grundlegende Verwendung der Validation Station.
- : Legt den Ankerauswahlmodus fest;
- : Löscht die gesamte Ankerauswahl.
Beim Erstellen einer neuen Vorlage wird beim ersten Öffnen des Vorlageneditors ein Erklärungstext angezeigt. Für den Fall, dass Sie erneut auf den Text zugreifen möchten, wechseln Sie zum Dokumentansichtsabschnitt auf der rechten Seite, wählen Sie Weitere Optionen aus und dann Erklärungstext anzeigen.
Tabelleninformationen können auf Zellen- oder Tabellenebene geändert werden. Weitere Informationen zum Konfigurieren von Tabellen auf Zellenebene und auf Tabellenebene finden Sie unter Aktuelle Validierungsstation .
Anker können definiert werden, sobald der Vorlageneditor über den Vorlagenmanager geöffnet wurde und sind unter den Optionen zum Auswahlmodus zu finden.
Beim Definieren oder Bearbeiten einer Vorlage auf Seitenebene (optional), muss zuerst die Auswahl von Seite 1 – Abgleichsinformationen durchgeführt werden. Dieser Schritt ist nur für feste Formvorlagen obligatorisch.
Die Auswahl zu Seite 1 – Abgleichsinformationen befindet sich auf der linken Seite des Bildschirms. Sie erfordert eine Texteingabe (tokens only are accepted (nur Token werden akzeptiert)) auf der ersten Seite der Vorlage, die sich immer an der gleichen Position innerhalb des jeweiligen Vorlagenlayouts befindet und ein eindeutiges Wort-Diagramm in alle Vorlagen bildet, die für einen bestimmten Dokumenttyp definiert sind (unter Berücksichtigung relativer Abstände und Winkel zwischen Wörtern).
Seite 1 – Abgleichsinformationen (und alle anderen Felder mit Seitenabgleichsinformationen) sind also „Fingerabdrücke“ einer bestimmten Seite und werden umfassend zur Identifizierung der richtigen Vorlage bei der Laufzeit verwendet.
Deshalb wird für das Feld Seite 1 – Abgleichsinformationen dringend empfohlen, 10 bis 20 Wörter auszuwählen, vorzugsweise länger, verteilt auf den gesamten Seitenbereich.
Die anderen Felder mit Seitenabgleichsinformationen (eines für jede Vorlagenseite) müssen nur ausgefüllt werden, wenn Sie die Extraktion von Daten aus dieser bestimmten Seite versuchen und keine vorlagenübergreifende Eindeutigkeit mehr erforderlich ist. Wenn keine Felder von einer bestimmten Seite extrahiert werden müssen, ist die Definition der Abgleichsinformationen auf Seitenebene für diese Seite nicht erforderlich.
Für alle Felder außer Tabellen besteht das Konfigurieren der Vorlage darin, einen Benutzerdefinierten Bereich auszuwählen und ihn einem bestimmten Feld zuzuweisen.
Bei festen Formkonfigurationen können Datenfelder nur mit der Auswahl eines Benutzerdefinierten Bereichs konfiguriert werden.
Für ein beliebiges Feld können Sie einen oder mehrere dieser Benutzerdefinierten Bereiche mithilfe der Schaltfläche Hinzufügen definieren. Wenn zwei oder mehr benutzerdefinierte Bereiche für ein einzelnes Feld definiert sind (dann zur Runtime) und wenn das Feld in der Taxonomie als Einzelwert definiert ist, werden alle Werte in einen einzelnen gemeldeten Wert verkettet. Wenn das Feld als Mehrfachwert definiert ist, wird jeder Wert einzeln gemeldet.
Das Symbol neben jedem Feld gibt den Typ der unterstützten Auswahl an: Token oder Benutzerdefinierter Bereich.
Wenn ein leerer Bereich ausgewählt wird, wird die Auswahl automatisch als Benutzerdefinierter Bereich festgelegt. Wenn Text im ausgewählten Bereich erkannt wird, werden Sie aufgefordert, den Typ der Auswahl zwischen Token oder Benutzerdefiniertem Bereich auszuwählen.
Anhand des Auswahlmodus der Validation Station können Sie Ihre Auswahl zwischen Token und benutzerdefinierten Bereichen sperren.
Wie oben erwähnt, gibt es Felder, in denen Informationen nur mithilfe von Token (z. B. die Felder Seite – Abgleichsinformationen) oder nur mit einem Benutzerdefinierten Bereich (z. B. einfache Felder) hinzugefügt werden können. Bei Tabellenfeldern können Sie Folgendes tun:
- Definieren Sie jede Zelle einzeln, sobald der Tabellen-Editor erweitert wurde – durch Hinzufügen der Auswahl eines Benutzerdefinierten Bereichs zu jeder Zelle einzeln;
- die Tabellenmarkierungsfunktion verwenden – indem Sie den Tabellenbereich markieren, Zeilen- und Spaltentrennzeichen festlegen und dann dem Feld die markierte Tabelle zuweisen. Stellen Sie sicher, dass der extrahierte Bereich die gleiche Anzahl von Spalten und Zeilen wie der Vorlagenbereich hat.
- Wählen Sie Weitere Optionen für das Tabellenfeld aus
- Wählen Sie Neue Tabelle extrahieren aus.
- Wählen Sie die Tabelle aus, die Sie extrahieren möchten.
- Wählen Sie für jedes Feld über jeder Tabellenspalte den Spaltennamen aus, den es darstellen soll.
Sie können auch Header extrahieren auswählen.
- Wählen Sie schließlich Neue Tabelle speichern aus.
Eine Methode zum Definieren der Grenzen eines benutzerdefinierten Bereichs, aus dem Daten extrahiert werden sollen, ist die Verwendung von Ankern auf Feldebene. Diese ermöglichen eine gezielte Datenextraktion basierend auf Konfigurationen auf Feldebene und ermöglichen so mehr Flexibilität beim Definieren Ihrer Formularextraktionsregeln.
Daher weiß der Form Extractor zur Laufzeit, wie Folgendes auszuführen ist:
- die Übereinstimmung einer Vorlage auf Seitenebene ermittelt und Informationen entsprechend der besten übereinstimmenden Vorlage auf Seitenebene extrahiert
- die Übereinstimmung ankerbasierter Einstellungen ermittelt und Informationen entsprechend ihrer Anwendung im zu verarbeitenden Dokument extrahiert
- entsprechende Konfidenzwerte für alle möglichen Übereinstimmungen berechnet, um das beste Ergebnis (höchste Wahrscheinlichkeit der Übereinstimmung) aller verfügbaren Optionen melden zu können.
Erstellen einer neuen Ankereinstellung
- Stellen Sie sicher, dass Sie sich im Ankerauswahlmodus befinden.
- Zeichnen Sie ein Feld um den Wertbereich.
- Wählen Sie eine Beschriftung (Hauptanker) für Ihren Wertbereich mit einer der folgenden Methoden aus:
- Wählen Sie das erste Wort aus und verwenden Sie dann
Ctrl + Select
für das letzte Wort der Auswahl. - Auswählen, ziehen und loslassen, um einen Wortbereich zu erfassen.
Hinweis: Eine Beschriftung darf nur aufeinanderfolgende Wörter aus derselben visuellen Zeile enthalten.
- Wählen Sie das erste Wort aus und verwenden Sie dann
- Wählen Sie alle zusätzlichen Anker aus, die Ihre Beschriftung eindeutig identifizieren würden. Es gilt dasselbe Auswahlprinzip.
- Weisen Sie Ihr Ankerkonstrukt dem entsprechenden Feld zu, indem Sie Wert extrahieren für dieses bestimmte Feld auswählen.
Abbildung 12. Beispiel zum Erstellen mehrerer Anker für ein Feld
Hinweis: Sie können auch anhand der vorherigen Beispiele auf dieser Seite erfahren, wie Sie eine Vorlage erstellen und Extraktionsbereiche und Anker definieren.
Eine vorhandene Ankereinstellung bearbeiten
- Markieren Sie Ihre Ankereinstellung.
- Nehmen Sie Änderungen daran vor (löschen Sie nach Bedarf alle Anker, die Beschriftung, oder den Wertbereich, fügen Sie neue Elemente hinzu usw.).
- Wählen Sie Weitere Optionen für einen Feldanker aus und verwenden Sie dann die Option Extrahierten Wert ändern, um die Feldzuordnung anzupassen.
Abbildung 13. Beispiel für das Ändern des extrahierten Werts für ein Feld
Hinweis:- Wenn Sie den Zielbereich löschen, werden alle Anker gelöscht und Sie beginnen von vorne.
- Wenn Sie die Beschriftung (Hauptanker) löschen, wird der erste Anker aus der Erstellreihenfolge zur neuen Beschriftung.
Bearbeiten einer vorhandenen Ankereinstellung
Um eine Ankereinstellung zu löschen, können Sie eine der folgenden Optionen verwenden:
- Wählen Sie Weitere Optionen für einen Feldanker aus und verwenden Sie die Option Als fehlend markieren für einen gespeicherten Wert.
Abbildung 14. Beispiel für die Verwendung der Option Als fehlend markieren, um eine Ankereinstellung zu löschen
- Wählen Sie Weitere Optionen für einen Feldanker aus und verwenden Sie die Option Wert entfernen im Falle einer Liste von Ankern, die für ein bestimmtes Feld definiert sind.
Abbildung 15. Beispiel für die Verwendung der Option Wert entfernen zum Löschen einer Ankereinstellung
Konfigurationen kombinieren und abgleichen
Für denselben Dokumenttyp können Sie beliebig viele Vorlagen definieren. Sie können mehrere Vorlagen auf Seitenebene, mehrere Anker für dasselbe Feld und auch Vorlagen haben, die Anker auf Seiten- und Feldebene enthalten.
- Stellen Sie beim Definieren von Ankern auf Feldebene sicher, dass Sich Ihre Beschriftung in der Nähe Ihres Wertbereichs befindet und sie von zusätzlichen Ankern unterstützt wird, wenn dasselbe Textkonstrukt an mehreren Stellen innerhalb desselben Dokuments zu finden ist.
- Je länger Ihre Beschriftungen und Anker sind, desto mehr Genauigkeit erhalten Sie.
- Der Wertbereich wird immer basierend auf seiner relativen Position gegenüber Ihrer Beschriftung (Hauptanker) berechnet. Wählen Sie Ihre Hauptanker entsprechend aus.
- Mit Ankern auf Feldebene können Felder innerhalb der Vorlage verschoben und trotzdem erfasst werden, was mehr Flexibilität bei Änderungen des Dokumentlayouts bietet.
Die Aktivität Form Extractor ist Teil der Document Understanding-Lösungen. Weitere Informationen finden Sie im Document Understanding-Leitfaden.
- Beschreibung
- Projektkompatibilität
- Konfiguration
- Der Vorlagenmanager-Assistent
- Konfigurieren der Verarbeitung von booleschen Feldern
- Exportieren und Importieren von Vorlagen
- Spezielle Situationen beim Importieren einer Vorlage
- Der Vorlageneditor-Assistent
- Konfigurieren von Ankern
- Konfigurieren von einfachen Feldern
- Konfigurieren von Tabellen
- Ankerkonfiguration
- Document Understanding-Integration