- Überblick
- Verträge zur Dokumentverarbeitung
- Versionshinweise
- Über die DocumentProcessing-Verträge
- Box-Klasse
- IPersistedActivity-Schnittstelle
- PrettyBoxConverter-Klasse
- IClassifierActivity-Schnittstelle
- IClassifierCapabilitiesProvider-Schnittstelle
- ClassifierDocumentType-Klasse
- ClassifierResult-Klasse
- ClassifierCodeActivity-Klasse
- ClassifierNativeActivity-Klasse
- ClassifierAsyncCodeActivity-Klasse
- ClassifierDocumentTypeCapability-Klasse
- ExtractorAsyncCodeActivity-Klasse
- ExtractorCodeActivity-Klasse
- ExtractorDocumentType-Klasse
- ExtractorDocumentTypeCapabilities-Klasse
- ExtractorFieldCapability-Klasse
- ExtractorNativeActivity-Klasse
- ExtractorResult-Klasse
- ICapabilitiesProvider-Schnittstelle
- IExtractorActivity-Schnittstelle
- ExtractorPayload-Klasse
- DocumentActionPriority-Enumeration
- DocumentActionData-Klasse
- DocumentActionStatus-Enumeration
- DocumentActionType-Enumeration
- DocumentClassificationActionData-Klasse
- DocumentValidationActionData-Klasse
- UserData-Klasse
- Document-Klasse
- DocumentSplittingResult-Klasse
- DomExtensions-Klasse
- Page-Klasse
- PageSection-Klasse
- Polygon-Klasse
- PolygonConverter-Klasse
- Metadatenklasse
- WordGroup-Klasse
- Word-Klasse
- ProcessingSource-Enumeration
- ResultsTableCell-Klasse
- ResultsTableValue-Klasse
- ResultsTableColumnInfo-Klasse
- ResultsTable-Klasse
- Rotation-Enumeration
- SectionType-Enumeration
- WordGroupType-Enumeration
- IDocumentTextProjection-Schnittstelle
- ClassificationResult-Klasse
- ExtractionResult-Klasse
- ResultsDocument-Klasse
- ResultsDocumentBounds-Klasse
- ResultsDataPoint-Klasse
- ResultsValue-Klasse
- ResultsContentReference-Klasse
- ResultsValueTokens-Klasse
- ResultsDerivedField-Klasse
- ResultsDataSource-Enumeration
- ResultConstants-Klasse
- SimpleFieldValue-Klasse
- TableFieldValue-Klasse
- DocumentGroup-Klasse
- DocumentTaxonomy-Klasse
- DocumentType-Klasse
- Field-Klasse
- FieldType-Enumeration
- LanguageInfo-Klasse
- MetadataEntry-Klasse
- TextType-Aufzählung
- TypeField-Klasse
- ITrackingActivity-Schnittstelle
- ITrainableActivity-Schnittstelle
- ITrainableClassifierActivity-Schnittstelle
- ITrainableExtractorActivity-Schnittstelle
- TrainableClassifierAsyncCodeActivity-Klasse
- TrainableClassifierCodeActivity-Klasse
- TrainableClassifierNativeActivity-Klasse
- TrainableExtractorAsyncCodeActivity-Klasse
- TrainableExtractorCodeActivity-Klasse
- TrainableExtractorNativeActivity-Klasse
- Document Understanding Digitizer
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Versionshinweise
- Über das Document Understanding-Aktivitätspaket
- Projektkompatibilität
- PDF-Passwort festlegen
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- PDF-Seitenbereich extrahieren
- Extract Document Data
- Validierungsaufgabe erstellen und warten
- Wait for Validation Task and Resume
- Create Validation Task
- Dokument klassifizieren (Classify Document)
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Wait For Classification Validation Task And Resume
- IntelligentOCR
- Versionshinweise
- Über das IntelligentOCR-Aktivitätspaket
- Projektkompatibilität
- Konfigurieren der Authentifizierung
- Taxonomie laden (Load Taxonomy)
- Digitalisieren von Dokumenten
- Dokumentbereich klassifizieren (Classify Document Scope)
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Document Understanding-Projektklassifizierer
- Intelligenter Schlüsselwortklassifizierer
- Create Document Validation Action
- Wait For Document Classification Action And Resume
- Klassifizierer-Scope trainieren
- Keyword Based Classifier Trainer
- Intelligent Keyword Classifier Trainer
- Datenextraktionsumfang
- Document Understanding-Projektextraktor
- Regex Based Extractor
- Form Extractor
- Extraktor für intelligente Formulare
- Aktuelle Validierungsstation
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Train Extractors Scope
- Extraktionsergebnisse exportieren
- ML-Services
- OCR
- OCR-Verträge
- Versionshinweise
- Über die OCR-Verträge
- Projektkompatibilität
- IOCRActivity-Schnittstelle
- OCRAsyncCodeActivity-Klasse
- OCRCodeActivity-Klasse
- OCRNativeActivity-Klasse
- Character-Klasse
- OCRResult-Klasse
- Word-Klasse
- FontStyles-Enumeration
- OCRRotation-Enumeration
- OCRCapabilities-Klasse
- OCRScrapeBase-Klasse
- OCRScrapeFactory-Klasse
- ScrapeControlBase-Klasse
- ScrapeEngineUsages-Enumeration
- ScrapeEngineBase
- ScrapeEngineFactory-Klasse
- ScrapeEngineProvider-Klasse
- OmniPage
- PDF
- [Nicht aufgeführt] Abbyy
- Versionshinweise
- Über das Abbyy-Aktivitätspaket
- Projektkompatibilität
- Abbyy OCR
- Abbyy Cloud OCR
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Dokument klassifizieren (Classify Document)
- Dokument verarbeiten (Process Document)
- Dokument validieren (Validate Document)
- Dokument exportieren (Export Document)
- Feld erhalten (Get Field)
- Tabelle erhalten (Get Table)
- Vorbereiten der Validierungsstationsdaten
- [Nicht aufgeführt] Abbyy Embedded
Document Understanding-Aktivitäten
Extraktor für intelligente Formulare
UiPath.IntelligentOCR.Activities.DataExtraction.IntelligentFormExtractor
Die Aktivität Intelligent Form Extractor ist veraltet und wird nicht mehr unterstützt. Sie wurde aus dem jeweiligen Paket entfernt, was bedeutet, dass Sie sie nur in Workflows verwenden können, in denen sie zuvor vor dieser Abschaffung hinzugefügt wurde.
Während Workflows, die die Aktivität Intelligent Form Extractor enthalten, weiterhin normal funktionieren, können Sie die Aktivität keinen neuen Workflows hinzufügen. Es wird empfohlen, stattdessen die Aktivität Form Extractor zu verwenden.
Analysiert, extrahiert, vergleicht und meldet die erforderlichen Informationen aus einem Dokument unter Berücksichtigung der Position der Wörter, einschließlich handschriftlicher und signierter Felder. Diese Aktivität kann nur zusammen mit der Aktivität Data Extraction Scope verwendet werden.
Verwenden Sie die folgenden Ressourcen, um Ihren Intelligent Form Extractor zu definieren und zu konfigurieren:
- Vorlagenmanager-Assistent;
- Taxonomiemanager
- Ankereinrichtung und -konfiguration.
Eigenschaften-Panel
Allgemein
- AnzeigeName (DisplayName) - Der Anzeigename der Aktivität.
Eingabe
- ApiKey – Gibt den API-Schlüssel des Kontos an.
- Endpunkt – Die URL zum UiPath® -Server. Standardmäßig ist der Endpunkt
https://du.uipath.com/svc/intelligentforms
. Weitere Informationen finden Sie unter Document Understanding – Öffentliche Endpunkte. - MinOverlapPercentage – Gibt den minimalen Überlappungsbereich (in Prozent) zwischen einem Rahmen im Dokument und einem Rahmen in der Vorlage an, der für eine Extraktion erforderlich ist. Der Prozentwert kann zwischen
0
und100
festgelegt werden. Der Standardwert ist65
. - Zeitüberschreitung - Gibt die Zeitspanne (in Millisekunden) an, in der auf eine Antwort vom Server gewartet wird, bevor ein Fehler ausgelöst wird. Der Standardwert ist 100.000 Millisekunden (100 Sekunden).
Sonstiges
- Privat (Private) - Bei Auswahl werden die Werte von Variablen und Argumenten nicht mehr auf der Stufe Verbose protokolliert.
Wichtig: Wenn Sie die cloudbasierte Version dieser Software zur Dokumentdatenextraktion mit einem beliebigen UiPath® Community-API-Schlüssel verwenden, werden die mit der Software verarbeiteten Dokumente von UiPath® zusammen mit allen personenbezogenen Daten, die sie für die Dienstüberwachung enthalten können, gespeichert und verwendet. Dokumente, die mit einem UiPath® -Serverendpunkt mit Enterprise-API-Schlüsseln verarbeitet werden, werden von UiPath® nicht gespeichert. Es werden keine Dokumente von UiPath® verarbeitet, wenn die Software bei Ihnen eingerichtet und verwendet wird.Hinweis:
Nachdem eine Vorlage erstellt wurde, zeigt die Aktivität möglicherweise eine Warnung an, die Sie darüber informiert, dass die zulässige Anzahl handschriftlicher Bereiche auf einer Seite möglicherweise überschritten wurde.
Der Workflow kann weiterhin ausgeführt werden, und es wird nur dann ein Fehler ausgegeben, wenn die Anzahl der handgeschriebenen Bereiche tatsächlich überschritten wurde (mehr als 60/Seite).
Damit können Sie Vorlagen für die in der Taxonomie definierten Dokumenttypen erstellen, bearbeiten, verwalten und exportieren/importieren.
Erstellen einer Vorlage
- Fügen Sie eine Intelligent Form Extractor-Aktivität zu Ihrem Workflow in einem Data Extraction Scope hinzu.
- Konfigurieren Sie den Extraktor, indem Sie Vorlagen verwalten auswählen.
Das Fenster Vorlagenmanager wird geöffnet.
Abbildung 1. Übersicht über den Vorlagenmanager-Assistenten
- Klicken Sie auf die Schaltfläche Vorlage erstellen zum Erstellen einer neuen Vorlage.
Abbildung 2. Übersicht über den Assistenten zum Erstellen einer Vorlage
Hinweis:Wenn das UiPath.IntelligentOCR.Activities-Paket auf v5.1.0 aktualisiert wurde, dann wurde der Parameter ForceApplyOCR durch ApplyOcrOnPDF ersetzt. Hier ist die Kompatibilität zwischen den alten und neuen Parametern:
- ForceApplyOCR = True wird ersetzt durch ApplyOcrOnPDF = Yes
- ForceApplyOCR = False wird ersetzt durch ApplyOcrOnPDF = Auto
- ForceApplyOCR = Empty wird ersetzt durch ApplyOcrOnPDF = Auto
- ForceApplyOCR =
<user-defined variable>
wird ersetzt durch ApplyOcrOnPDF = Auto
- Wählen Sie den Dokumenttyp für Ihre Vorlage aus der Dropdownliste Dokumenttyp aus.
Hinweis: Alle Dokumenttypen basieren auf der Taxonomie. Stellen Sie sicher, dass Sie eine Taxonomie im Projektordner hinzugefügt oder erstellt haben.
- Fügen Sie den Namen der Vorlage im Feld Vorlagenname hinzu. Wählen Sie einen passenden Namen für die Version oder das Layout Ihres Dokuments.
- Fügen Sie den Pfad des Dokuments im Feld Vorlagendokument hinzu.
- Navigieren Sie mit der Schaltfläche Durchsuchen zum Pfad der Datei.
- Wählen Sie ein OCR-Modul von der Dropdownliste OCR-Modul aus und konfigurieren Sie es gemäß den Anforderungen.
- Wählen Sie Konfigurieren, um die Vorlagenbearbeitung auszulösen.
Die Option OCR auf PDF anwenden legt fest, ob der OCR-Prozess auf PDF-Dokumente angewendet werden soll oder nicht. In der Dropdownliste sind drei Optionen verfügbar: True, Falseund Auto.
Bei True wird die OCR auf allen PDF-Seiten des Dokuments angewendet. Wenn auf False festgelegt, wird nur digital eingegebener Text extrahiert. Bei dem Standardwert Automatisch wird ermittelt, ob das Dokument abhängig vom Eingabedokument den OCR-Algorithmus anwenden muss.
Jedes OCR-Modul verfügt über eine eigene Reihe benutzerdefinierter Optionen. Unter OCR-Module finden Sie weitere Details zu allen Optionen, die für jedes OCR-Modul verfügbar sind.
Wenn Sie bereits eine Vorlage erstellt haben, kann sie bearbeitet, exportiert oder entfernt werden.
Die Optionen Löschen und Exportieren sind nur verfügbar, wenn mindestens eine Vorlage ausgewählt ist. Die Optionen Bearbeiten und Entfernen für eine einzelne Vorlage sind immer verfügbar.
Bei den Dokumenten, die Kontrollkästchen enthalten, haben Sie die Möglichkeit, bekannte Synonyme für die Optionen Yes (Ja) und No (Nein) hinzuzufügen, oder Sie können mit einer von uns zusammengestellten Liste beginnen (siehe die Vorschläge zu Empfehlung hinzufügen). Diese Werte werden für die Boolesche Inhaltsinterpretation verwendet, bei der ein erfasster Wert einem gemeldeten Wert Yes (Ja) oder No (Nein) zugeordnet wird.
Wählen Sie neben Synonyme für Ja und Synonyme für Nein die Option Empfehlung hinzufügen aus, um die Vorschläge zu generieren.
Sie können Vorlagen importieren, die von anderen Workflows erstellt und exportiert wurden. Verwenden Sie diese Funktionen, um Vorlagen zwischen Projekten freizugeben. Sobald ein Dokumenttyp mit dem Intelligent Form Extractor konfiguriert wurde, müssen Sie die Vorlagen in einer neuen Implementierung nicht noch einmal konfigurieren.
Exportvorgang
Dies sind die Schritte, die Sie ausführen müssen, um eine Vorlage zu exportieren:
- Erstellen Sie eine oder mehrere Vorlagen, indem Sie die am Anfang dieser Seite erläuterten Schritte ausführen.
- Wählen Sie die Vorlagen aus, die Sie exportieren möchten.
- Wählen Sie eine Export-Option aus:
- Export mit ursprünglichen Dateien
Beim Exportieren mit Originaldateien werden sie an den Export angehängt.
- Export ohne ursprüngliche DateienAbbildung 5. Die im Vorlagenmanager-Assistenten verfügbaren Export-Optionen
- Export mit ursprünglichen Dateien
- Speichern Sie das Archiv der Vorlage mit dem gewünschten Namen.
- Nach dem Speichern der Vorlage wird eine Meldung angezeigt. Wählen Sie OK aus.
Abbildung 6. Die Meldung „X-Vorlage(n) erfolgreich exportiert“
Hinweis:Wenn Sie den Inhalt der Dokumente, auf denen Sie Ihre Vorlagen erstellt haben, nicht freigeben können, verwenden Sie die Option Ohne ursprüngliche Dateien exportieren. Sie können das Vorlagenarchiv weiterhin freigeben und in andere Projekte importieren, sie jedoch nicht mehr bearbeiten oder anzeigen.
Wenn Sie die Vorlagen bearbeiten möchten, sobald sie in ein anderes Projekt importiert wurden, verwenden Sie beim Exportieren und Importieren die Option Mit ursprünglichen Dateien exportieren.
Importvorgang
Hier sind die Schritte, die Sie ausführen müssen, um eine Vorlage zu importieren:
- Wählen Sie Importieren aus.
Abbildung 7. Die Aktion zur Auswahl von Importieren
- Wählen Sie ein Archiv aus. Der Importassistent wird angezeigt und zeigt alle Dokumenttypen und alle Vorlagen an, die im ausgewählten Exportarchiv verfügbar sind. Wählen Sie die Vorlagen aus, die Sie importieren möchten, und wählen Sie die richtige Import-Option aus:
- Mit ursprünglichen Dateien importieren
- Ohne ursprüngliche Dateien importierenAbbildung 8. Die im Vorlagenmanager-Assistenten verfügbaren Import-Optionen
Hinweis:- Beim Importieren von Vorlagen werden Dokumenttypen automatisch in der Taxonomie des Projekts erstellt. Wenn bereits ein Dokumenttyp mit demselben Namen vorhanden ist, wird ein weiterer durch Anhängen einer Zahl an den Dokumenttypnamen erstellt.
- Wenn Sie Vorlagen importieren, die ohne die ursprünglichen Dateien exportiert wurden, oder wenn Sie Vorlagen ohne die ursprünglichen Dateien importieren, gibt es dafür keine Anzeige- oder Bearbeitungsoptionen.
Spezielle Situationen beim Importieren einer Vorlage
Beim Importieren einer Vorlage können mehrere spezielle Situationen auftreten. In der folgenden Liste werden jeder Importtyp und seine Besonderheiten erläutert:
- Neuer Dokumenttyp: Wenn ein neuer Dokumenttyp importiert wird, wird in der Assistentenkonfiguration ein neues Feld hinzugefügt, das Sie darüber informiert, dass eine neue Vorlage erstellt werden soll.
- Doppelter Dokumenttyp: Wenn ein identischer Dokumenttyp importiert wird, wird die folgende Warnmeldung angezeigt: „Diese Vorlage ist bereits vorhanden und wird überschrieben.“
- Erweiterte Vorlage: Enthält die importierte Dokumenttypvorlage mehr Felder als die bereits vorhandene, wird die folgende Warnmeldung angezeigt: „Dieser Dokumenttyp wird wie folgt aktualisiert: Die folgenden Felder sind nicht vorhanden und werden erstellt.“
- Erweiterter Dokumenttyp: Wenn der Benutzer einen Dokumenttyp importiert, der neben den bereits vorhandenen zusätzliche Felder enthält, wird die folgende Warnmeldung angezeigt: „Dieser Dokumenttyp wird wie folgt angepasst: Die folgenden Felder haben keine Konfigurationen zum Importieren.“
- Dokumenttyp mit identischem Namen, aber unterschiedlichem Inhalt: Wenn der importierte Dokumenttyp denselben Namen, aber verschiedene Felder hat wie der vorhandene, wird die folgende Warnmeldung angezeigt: „Dieser Dokumenttyp wird wie folgt aktualisiert:“
- „Die folgenden Felder sind nicht vorhanden und werden erstellt“
- „Die folgenden Felder haben keine zu importierenden Konfigurationen“
- Dokumenttyp mit fehlender Tabelle: Wenn der importierte Dokumenttyp neben den bereits vorhandenen zusätzliche Felder enthält, wird die folgende Warnmeldung angezeigt: „Dieser Dokumenttyp wird wie folgt angepasst: Die folgenden Felder haben keine Import-Konfigurationen.“
- Dokumenttyp mit erweiterter Tabelle: Wenn der importierte Dokumenttyp eine Tabelle mit zusätzlichen Spalten enthält, wird die folgende Warnmeldung angezeigt: „Dieses Dokument wird wie folgt aktualisiert: Die folgenden Felder sind nicht vorhanden und werden erstellt.“
- Dokumenttyp mit reduzierter Tabelle: Wenn der Benutzer einen Dokumenttyp importiert, der eine Tabelle mit fehlenden Spalten enthält, wird die folgende Warnmeldung angezeigt: „Dieses Dokument wird wie folgt aktualisiert: Die folgenden Felder haben keine importfähigen Konfigurationen.“
- Tabellenvorlage mit unterschiedlichen Dokumenttypen: Wenn der Benutzer eine Dokumenttypvorlage importiert, die eine Tabelle mit unterschiedlichen Dokumenttypen enthält, wird eine neue Vorlage erstellt.
Wenn Ihre Taxonomie eine Tabelle mit einem Feld mit einem anderen Dokumenttyp enthält, wird die folgende Meldung angezeigt:
Das Feld mit der IDxyz
wurde sowohl in der importierten Taxonomie als auch in der vorhandenen Taxonomie gefunden, ihre Typen sind jedoch inkompatibel (beide müssen Tabellen oder keine Tabellen sein).
Allgemeine Überlegungen
Der Vorlageneditor baut auf die Funktionalität der Validation Station auf. Um darauf zuzugreifen, wählen Sie Bearbeiten für eine Vorlage aus.
Unter Validation Station erfahren Sie mehr über die grundlegende Verwendung der Validation Station.
- : Legt den Ankerauswahlmodus fest.
- : Löscht die gesamte Ankerauswahl.
Beim Erstellen einer neuen Vorlage wird beim ersten Öffnen des Vorlageneditors ein Erklärungstext angezeigt. Für den Fall, dass Sie erneut auf den Text zugreifen möchten, wechseln Sie zum Dokumentansichtsabschnitt auf der rechten Seite, wählen Sie Weitere Optionen aus und dann Erklärungstext anzeigen.
Konfigurieren von Ankern
Anker können definiert werden, sobald der Vorlageneditor über den Vorlagenmanager geöffnet wurde und sind unter den Optionen zum Auswahlmodus zu finden.
Beim Definieren oder Bearbeiten einer Vorlage auf Seitenebene (optional), muss zuerst die Auswahl von Seite 1 – Abgleichsinformationen durchgeführt werden. Dieser Schritt ist nur für feste Formvorlagen obligatorisch.
Die Auswahl zu Seite 1 – Abgleichsinformationen befindet sich auf der linken Seite des Bildschirms. Sie erfordert eine Texteingabe (tokens only are accepted (nur Token werden akzeptiert)) auf der ersten Seite der Vorlage, die sich immer an der gleichen Position innerhalb des jeweiligen Vorlagenlayouts befindet und ein eindeutiges Wort-Diagramm in alle Vorlagen bildet, die für einen bestimmten Dokumenttyp definiert sind (unter Berücksichtigung relativer Abstände und Winkel zwischen Wörtern).
Seite 1 – Abgleichsinformationen (und alle anderen Felder mit Seitenabgleichsinformationen) sind also „Fingerabdrücke“ einer bestimmten Seite und werden umfassend zur Identifizierung der richtigen Vorlage bei der Laufzeit verwendet.
Deshalb wird für das Feld Seite 1 – Abgleichsinformationen dringend empfohlen, 10 bis 20 Wörter auszuwählen, vorzugsweise länger, verteilt auf den gesamten Seitenbereich.
Die anderen Felder mit Seitenabgleichsinformationen (eines für jede Vorlagenseite) müssen nur ausgefüllt werden, wenn Sie die Extraktion von Daten aus dieser bestimmten Seite versuchen und keine vorlagenübergreifende Eindeutigkeit mehr erforderlich ist. Wenn keine Felder von einer bestimmten Seite extrahiert werden müssen, ist die Definition der Abgleichsinformationen auf Seitenebene für diese Seite nicht erforderlich.
Konfigurieren von einfachen Feldern
Für alle Felder außer Tabellen besteht das Konfigurieren der Vorlage darin, einen Benutzerdefinierten Bereich auszuwählen und ihn einem bestimmten Feld zuzuweisen.
Bei festen Formkonfigurationen können Datenfelder nur mit der Auswahl eines Benutzerdefinierten Bereichs konfiguriert werden.
Für ein beliebiges Feld können Sie einen oder mehrere dieser Benutzerdefinierten Bereiche mithilfe der Option Hinzufügen definieren. Wenn zwei oder mehr Benutzerdefinierte Bereiche für ein einzelnes Feld definiert sind (dann zur Runtime) und wenn das Feld in der Taxonomie als Einzelwert definiert ist, werden alle Werte in einen einzelnen gemeldeten Wert verkettet. Wenn das Feld als Mehrfachwert definiert ist, wird jeder Wert einzeln gemeldet.
Das Symbol neben jedem Feld gibt den Typ der unterstützten Auswahl an: Token oder Benutzerdefinierter Bereich.
Wenn ein leerer Bereich ausgewählt wird, wird die Auswahl automatisch als Benutzerdefinierter Bereich festgelegt. Wenn Text im ausgewählten Bereich erkannt wird, werden Sie aufgefordert, den Typ der Auswahl zwischen Token oder Benutzerdefiniertem Bereich auszuwählen.
Anhand des Auswahlmodus der Validation Station können Sie Ihre Auswahl zwischen Token und benutzerdefinierten Bereichen sperren.
Konfigurieren von Tabellen
Wie oben erwähnt, gibt es Felder, in denen Informationen nur mithilfe von Token (z. B. die Felder Seite – Abgleichsinformationen) oder nur mit einem Benutzerdefinierten Bereich (z. B. einfache Felder) hinzugefügt werden können. Bei Tabellenfeldern können Sie Folgendes tun:
- Jede Zelle einzeln definieren, sobald der Tabellen-Editor erweitert wurde – indem Sie jeder Zelle einzeln die Auswahl eines Benutzerdefinierten Bereichs hinzufügen.
- Die Tabellenmarkierungsfunktion verwenden – indem Sie den Tabellenbereich markieren, Zeilen- und Spaltentrennzeichen festlegen und dann dem Feld die markierte Tabelle zuweisen. Stellen Sie sicher, dass der extrahierte Bereich die gleiche Anzahl von Spalten und Zeilen wie der Vorlagenbereich hat.
- Wählen Sie Weitere Optionen für das Tabellenfeld aus
- Wählen Sie Neue Tabelle extrahieren aus.
- Wählen Sie die Tabelle aus, die Sie extrahieren möchten.
- Wählen Sie für jedes Feld über jeder Tabellenspalte den Spaltennamen aus, den es darstellen soll.
Sie können auch Header extrahieren auswählen.
- Wählen Sie schließlich Neue Tabelle speichern aus.
Eine Methode zum Definieren der Grenzen eines benutzerdefinierten Bereichs, aus dem Daten extrahiert werden sollen, ist die Verwendung von Ankern auf Feldebene. Diese ermöglichen eine gezielte Datenextraktion basierend auf Konfigurationen auf Feldebene und ermöglichen so mehr Flexibilität beim Definieren Ihrer Formularextraktionsregeln.
Daher weiß der Intelligent Form Extractor zur Laufzeit wie er Folgendes ausführt:
- die Übereinstimmung einer Vorlage auf Seitenebene ermittelt und Informationen entsprechend der besten übereinstimmenden Vorlage auf Seitenebene extrahiert
- die Übereinstimmung ankerbasierter Einstellungen ermittelt und Informationen entsprechend ihrer Anwendung im zu verarbeitenden Dokument extrahiert
- entsprechende Konfidenzwerte für alle möglichen Übereinstimmungen berechnet, um das beste Ergebnis (höchste Wahrscheinlichkeit der Übereinstimmung) aller verfügbaren Optionen melden zu können.
Erstellen einer neuen Ankereinstellung
- Stellen Sie sicher, dass Sie sich im Ankerauswahlmodus befinden.
- Zeichnen Sie ein Feld um den Wertbereich.
- Wählen Sie eine Beschriftung (Hauptanker) für Ihren Wertbereich mit einer der folgenden Methoden aus:
- Wählen Sie das erste Wort aus und verwenden Sie dann
Ctrl + Select
für das letzte Wort der Auswahl. - Auswählen, ziehen und loslassen, um einen Wortbereich zu erfassen.
Hinweis: Eine Beschriftung darf nur aufeinanderfolgende Wörter aus derselben visuellen Zeile enthalten.
- Wählen Sie das erste Wort aus und verwenden Sie dann
- Wählen Sie alle zusätzlichen Anker aus, die Ihre Beschriftung eindeutig identifizieren würden. Es gilt dasselbe Auswahlprinzip.
- Weisen Sie Ihr Ankerkonstrukt dem entsprechenden Feld zu, indem Sie Wert extrahieren für dieses bestimmte Feld auswählen.
Abbildung 12. Beispiel zum Erstellen mehrerer Anker für ein Feld
Hinweis: Sie können auch anhand der vorherigen Beispiele auf dieser Seite erfahren, wie Sie eine Vorlage erstellen und Extraktionsbereiche und Anker definieren.
Eine vorhandene Ankereinstellung bearbeiten
- Markieren Sie Ihre Ankereinstellung.
- Nehmen Sie Änderungen daran vor (löschen Sie nach Bedarf alle Anker, die Beschriftung, oder den Wertbereich, fügen Sie neue Elemente hinzu usw.).
- Wählen Sie Weitere Optionen für einen Feldanker aus und verwenden Sie dann die Option Extrahierten Wert ändern, um die Feldzuordnung anzupassen.
Abbildung 13. Beispiel für das Ändern des extrahierten Werts für ein Feld
Hinweis:- Wenn Sie den Zielbereich löschen, werden alle Anker gelöscht und Sie beginnen von vorne.
- Wenn Sie die Beschriftung (Hauptanker) löschen, wird der erste Anker aus der Erstellreihenfolge zur neuen Beschriftung.
Bearbeiten einer vorhandenen Ankereinstellung
Möglichkeiten zum Löschen einer Ankereinstellung:
- Wählen Sie Weitere Optionen für einen Feldanker aus und verwenden Sie die Option Als fehlend markieren für einen gespeicherten Wert.
Abbildung 14. Beispiel für die Verwendung der Option Als fehlend markieren, um eine Ankereinstellung zu löschen
- Wählen Sie Weitere Optionen für einen Feldanker aus und verwenden Sie die Option Wert entfernen im Falle einer Liste von Ankern, die für ein bestimmtes Feld definiert sind.
Abbildung 15. Beispiel für die Verwendung der Option Wert entfernen zum Löschen einer Ankereinstellung
Konfigurationen kombinieren und abgleichen
Für denselben Dokumenttyp können Sie beliebig viele Vorlagen definieren. Sie können mehrere Vorlagen auf Seitenebene, mehrere Anker für dasselbe Feld und auch Vorlagen haben, die Anker auf Seiten- und Feldebene enthalten.
- Stellen Sie beim Definieren von Ankern auf Feldebene sicher, dass Sich Ihre Beschriftung in der Nähe Ihres Wertbereichs befindet und sie von zusätzlichen Ankern unterstützt wird, wenn dasselbe Textkonstrukt an mehreren Stellen innerhalb desselben Dokuments zu finden ist.
- Je länger Ihre Beschriftungen und Anker sind, desto mehr Genauigkeit erhalten Sie.
Der Wertbereich wird immer basierend auf seiner relativen Position gegenüber Ihrer Beschriftung (Hauptanker) berechnet. Wählen Sie die Hauptanker entsprechend aus. Mit Ankern auf Feldebene können Felder innerhalb der Vorlage verschoben und trotzdem erfasst werden, was mehr Flexibilität bei Änderungen des Dokumentlayouts bietet.
Die Aktivität Intelligent Form Extractor ist Teil der Document Understanding-Lösungen. Weitere Informationen finden Sie im Document Understanding-Leitfaden.