Aktivitäten – Form Extractor

Beschreibung

Hinweis: Aus Lizenzierungsgründen erfordert die Form Extractor -Aktivität eine Internetverbindung, um den Roboter auszuführen.

Der Form Extractor eignet sich am besten zum Extrahieren, Abgleichen und Melden bestimmter Informationen, indem er die Position des Wortes im Dokument analysiert oder eine Signatur erkennt. Diese Aktivität kann nur zusammen mit der Aktivität Data Extraction Scope verwendet werden. Handgeschriebener Text kann auch erkannt werden, wenn die Form Extractor -Aktivität zusammen mit der UiPath Document OCR- Aktivität verwendet wird.

Projektkompatibilität

Windows-Legacy | Windows

Konfiguration

Eigenschaften-Panel

Allgemein

AnzeigeName (DisplayName) - Der Anzeigename der Aktivität.

Eingabe

ApiKey – Gibt den API-Schlüssel des Kontos an. Das Feld API-Schlüssel wird automatisch vorab ausgefüllt, wenn es in den lokalen Projekteinstellungen oder im Document Understanding-Framework definiert ist.
Endpunkt – Die URL zum UiPath® -Server. Standardmäßig ist der Endpunkt https://du.uipath.com/svc/formextractor. Weitere Informationen finden Sie unter Document Understanding – Öffentliche Endpunkte.
MinOverlapPercentage – Gibt den minimalen Überlappungsbereich (in Prozent) zwischen einem Rahmen im Dokument und einem Rahmen in der Vorlage an, der für eine Extraktion erforderlich ist. Der Prozentwert kann zwischen 0 und 100festgelegt werden. Der Standardwert ist 65.
Zeitüberschreitung - Gibt die Zeitspanne (in Millisekunden) an, in der auf eine Antwort vom Server gewartet wird, bevor ein Fehler ausgelöst wird. Der Standardwert ist 100.000 Millisekunden (100 Sekunden).

Sonstiges

Privat (Private) - Bei Auswahl werden die Werte von Variablen und Argumenten nicht mehr auf der Stufe Verbose protokolliert.
Hinweis: Für einen Dokumenttypkönnen mehrere Vorlagen definiert werden. Wenn die Aktivität ausgeführt wird, wählt der Extraktor die am besten passende Vorlage basierend auf den Informationen auf der ersten Seite aus.

Der Vorlagenmanager-Assistent

Damit können Sie Vorlagen für die in der Taxonomie definierten Dokumenttypen erstellen, bearbeiten, verwalten und exportieren/importieren.

Erstellen einer Vorlage

Fügen Sie eine Form Extractor-Aktivität zu Ihrem Workflow in einer Data Extraction Scope-Aktivität hinzu.
Konfigurieren Sie den Extraktor, indem Sie Vorlagen verwalten auswählen.
Das Fenster Vorlagenmanager wird geöffnet.
Abbildung 1. Übersicht über den Vorlagenmanager-Assistenten
Klicken Sie auf die Schaltfläche Vorlage erstellen zum Erstellen einer neuen Vorlage.
Abbildung 2. Übersicht über die Konfigurationsfelder Neue Vorlage erstellen
Hinweis:
Wenn das UiPath.IntelligentOCR.Activities-Paket auf v5.1.0 aktualisiert wurde, dann wurde der Parameter ForceApplyOCR durch ApplyOcrOnPDF ersetzt. Hier ist die Kompatibilität zwischen den alten und neuen Parametern:
- ForceApplyOCR = True wird ersetzt durch ApplyOcrOnPDF = Yes
- ForceApplyOCR = False wird ersetzt durch ApplyOcrOnPDF = Auto
- ForceApplyOCR = Empty wird ersetzt durch ApplyOcrOnPDF = Auto
- ForceApplyOCR = <user-defined variable> wird ersetzt durch ApplyOcrOnPDF = Auto
Die Option OCR auf PDF anwenden legt fest, ob der OCR-Prozess auf PDF-Dokumente angewendet werden soll oder nicht. In der Dropdownliste sind drei Optionen verfügbar: True, Falseund Auto.

Bei True wird die OCR auf allen PDF-Seiten des Dokuments angewendet. Wenn auf False festgelegt, wird nur digital eingegebener Text extrahiert. Bei dem Standardwert Automatisch wird ermittelt, ob das Dokument abhängig vom Eingabedokument den OCR-Algorithmus anwenden muss.

Jedes OCR-Modul verfügt über eine eigene Reihe benutzerdefinierter Optionen. Weitere Informationen zu allen Optionen, die für jedes OCR -Modul verfügbar sind, finden Sie unter OCR-Modul. Das standardmäßige OCR-Modul ist UiPath Document OCR.
Wählen Sie den Dokumenttyp für Ihre Vorlage aus der Dropdownliste Dokumenttyp aus.
Hinweis: Alle Dokumenttypen basieren auf der Taxonomie. Stellen Sie sicher, dass Sie eine Taxonomie im Projektordner hinzugefügt oder erstellt haben.
Fügen Sie den Namen der Vorlage im Feld Vorlagenname hinzu. Wählen Sie einen passenden Namen für die Version oder das Layout Ihres Dokuments.
Fügen Sie den Pfad des Dokuments im Feld Vorlagendokument hinzu.
Navigieren Sie mit der Option Durchsuchen zum Pfad der Datei.
Wählen Sie ein OCR-Modul von der Dropdownliste OCR-Modul aus und konfigurieren Sie es gemäß den Anforderungen.
Wählen Sie Konfigurieren, um die Vorlagenbearbeitung auszulösen.

Wenn Sie bereits eine Vorlage erstellt haben, kann sie bearbeitet, exportiert oder entfernt werden. Die Optionen Löschen und Exportieren sind nur verfügbar, wenn mindestens eine Vorlage ausgewählt ist. Die Optionen Bearbeiten und Entfernen für eine einzelne Vorlage sind immer verfügbar.

Abbildung 3. Animiertes Bild zur Auswahl der Optionen Löschen oder Exportieren für eine Vorlage

Konfigurieren der Verarbeitung von booleschen Feldern

Bei den Dokumenten, die Kontrollkästchen enthalten, haben Sie die Möglichkeit, bekannte Synonyme für die Optionen Ja und Nein hinzuzufügen, oder Sie können mit einer von UiPath® zusammengestellten Liste beginnen (auswählen Empfehlung hinzufügen ). Diese Werte werden für die Boolean -Inhaltsinterpretation verwendet, bei der ein erfasster Wert einem gemeldeten Wert Yes (Ja) oder No (Nein) zugeordnet wird.

Abbildung 4. Animiertes Bild, das den Vorschlag zeigt, der nach der Auswahl von Empfehlung hinzufügen für die Felder Synonyme für Ja und Synonyme für Nein generiert wird.

Hinweis: Das Kontrollkästchen Groß-/Kleinschreibung wird beachtet muss aktiviert werden, wenn bei den hinzugefügten Synonymen die Groß-/Kleinschreibung beachtet wird.

Exportieren und Importieren von Vorlagen

Sie können Vorlagen importieren, die von anderen Workflows erstellt und exportiert wurden. Verwenden Sie diese Funktionen, um Vorlagen zwischen Projekten freizugeben. Sobald ein Dokumenttyp mit dem Intelligent Form Extractor konfiguriert wurde, müssen Sie die Vorlagen in einer neuen Implementierung nicht noch einmal konfigurieren.

Exportvorgang

Dies sind die Schritte, die Sie ausführen müssen, um eine Vorlage zu exportieren:

Erstellen Sie eine oder mehrere Vorlagen, indem Sie die am Anfang dieser Seite erläuterten Schritte ausführen.
Wählen Sie die Vorlagen aus, die Sie exportieren möchten.
Wählen Sie eine Export-Option aus:
1. Export mit ursprünglichen Dateien
  Beim Exportieren mit Originaldateien werden sie an den Export angehängt.
2. Export ohne ursprüngliche Dateien
  Abbildung 5. Die Aktion zur Auswahl der Optionen Mit ursprünglichen Dateien exportieren
Speichern Sie das Archiv der Vorlage mit dem gewünschten Namen.
Nach dem Speichern der Vorlage wird eine Meldung angezeigt. Wählen Sie OK aus.
Abbildung 6. Die Meldung „X“ wurde erfolgreich exportiert

Hinweis:
Wenn Sie den Inhalt der Dokumente, auf denen Sie Ihre Vorlagen erstellt haben, nicht freigeben können, verwenden Sie die Option Ohne ursprüngliche Dateien exportieren. Sie können das Vorlagenarchiv weiterhin freigeben und in andere Projekte importieren, sie jedoch nicht mehr bearbeiten oder anzeigen.

Wenn Sie die Vorlagen bearbeiten möchten, sobald sie in ein anderes Projekt importiert wurden, verwenden Sie beim Exportieren und Importieren die Option Mit ursprünglichen Dateien exportieren.

Importvorgang

Hier sind die Schritte, die Sie ausführen müssen, um eine Vorlage zu importieren:

Wählen Sie Importieren aus.
Abbildung 7. Die Aktion zur Auswahl von Import im Vorlagenmanager-Assistenten
Wählen Sie ein Archiv aus. Der Importassistent wird angezeigt und zeigt alle Dokumenttypen und alle Vorlagen an, die im ausgewählten Exportarchiv verfügbar sind. Wählen Sie die Vorlagen aus, die Sie importieren möchten, und wählen Sie die gewünschte Import- Option aus:
1. Mit ursprünglichen Dateien importieren
2. Ohne ursprüngliche Dateien importieren
  Abbildung 8. Die Importoptionen im Vorlagenmanager- Assistenten
  Hinweis:
  - Beim Importieren von Vorlagen werden Dokumenttypen automatisch in der Taxonomie des Projekts erstellt. Wenn bereits ein Dokumenttyp mit demselben Namen vorhanden ist, wird ein weiterer durch Anhängen einer Zahl an den Dokumenttypnamen erstellt.
  - Wenn Sie Vorlagen importieren, die ohne die ursprünglichen Dateien exportiert wurden, oder wenn Sie Vorlagen ohne die ursprünglichen Dateien importieren, gibt es dafür keine Anzeige- oder Bearbeitungsoptionen.

Spezielle Situationen beim Importieren einer Vorlage

Beim Importieren einer Vorlage können mehrere spezielle Situationen auftreten. In der folgenden Liste werden jede Situation und ihre Besonderheiten beschrieben:

Neuer Dokumenttyp: Wenn ein neuer Dokumenttyp importiert wird, wird im Assistentenkonfigurator ein neues Feld hinzugefügt, das Sie darüber informiert, dass eine neue Vorlage erstellt werden soll.
Doppelter Dokumenttyp: Wenn ein identischer Dokumenttyp importiert wird, wird die folgende Warnmeldung angezeigt: „Diese Vorlage ist bereits vorhanden und wird überschrieben.“
Erweiterte Vorlage: Wenn eine Dokumenttypvorlage importiert wird, die zusätzliche Felder im Vergleich zur bereits vorhandenen enthält, wird die folgende Warnmeldung angezeigt: „Dieser Dokumenttyp wird wie folgt aktualisiert: Das/die folgenden Feld(er) sind nicht vorhanden und werden erstellt.“
Erweiterter Dokumenttyp: Wenn der Benutzer einen Dokumenttyp importiert, der neben den bereits vorhandenen zusätzliche Felder enthält, wird die folgende Warnmeldung angezeigt: „Dieser Dokumenttyp wird wie folgt angepasst: Die folgenden Felder haben keine Konfigurationen zum Importieren.“
Dokumenttyp mit identischem Namen, aber unterschiedlichem Inhalt: Wenn der importierte Dokumenttyp denselben Namen, aber verschiedene Felder hat wie der vorhandene, wird die folgende Warnmeldung angezeigt: „Dieser Dokumenttyp wird wie folgt aktualisiert:“
- „Die folgenden Felder sind nicht vorhanden und werden erstellt“
- „Die folgenden Felder haben keine zu importierenden Konfigurationen“
Dokumenttyp mit fehlender Tabelle: Wenn der importierte Dokumenttyp neben den bereits vorhandenen zusätzliche Felder enthält, wird die folgende Warnmeldung angezeigt: „Dieser Dokumenttyp wird wie folgt angepasst: Die folgenden Felder haben keine Import-Konfigurationen.“
Dokumenttyp mit erweiterter Tabelle: Wenn der Benutzer einen Dokumenttyp importiert, der eine Tabelle mit zusätzlichen Spalten enthält, wird die folgende Warnmeldung angezeigt: „Dieses Dokument wird wie folgt aktualisiert: Die folgenden Felder sind nicht vorhanden und werden erstellt “.
Dokumenttyp mit reduzierter Tabelle: Wenn der Benutzer einen Dokumenttyp importiert, der eine Tabelle mit fehlenden Spalten enthält, wird die folgende Warnmeldung angezeigt: „Dieses Dokument wird wie folgt aktualisiert: Die folgenden Felder haben keine Import-Konfigurationen “
Tabellenvorlage mit unterschiedlichen Dokumenttypen: Wenn Sie eine Dokumenttypvorlage importieren, die eine Tabelle mit unterschiedlichen Dokumenttypen enthält, wird eine neue Vorlage erstellt. Wenn Ihre Taxonomie eine Tabelle mit einem Feld mit einem anderen Dokumenttyp enthält, wird folgende Meldung angezeigt: „Das Feld mit id xyz wurde sowohl in der importierten Taxonomie als auch in der vorhandenen Taxonomie gefunden, aber ihre Typen sind entweder nicht kompatibel beide müssen Tabellen sein, oder keines von ihnen).“

Der Vorlageneditor-Assistent

Allgemeine Überlegungen

Der Vorlageneditor baut auf die Funktionalität der Validation Station auf. Um darauf zuzugreifen, wählen Sie Bearbeiten aus für eine Vorlage.

Unter Validation Station erfahren Sie mehr über die grundlegende Verwendung der Validation Station.

Neben den Optionen, die im rechten Teil der Anzeige der Validation Station verfügbar sind, gibt es zwei spezifische Optionen für den Vorlageneditor:

: Legt den Ankerauswahlmodus fest;
: Löscht die gesamte Ankerauswahl.

Beim Erstellen einer neuen Vorlage wird beim ersten Öffnen des Vorlageneditors ein Erklärungstext angezeigt. Für den Fall, dass Sie erneut auf den Text zugreifen möchten, wechseln Sie zum Dokumentansichtsabschnitt auf der rechten Seite, wählen Sie Weitere Optionen aus und dann Erklärungstext anzeigen.

Abbildung 9. Die Aktion zum Anzeigen des Erklärungstexts

Tabelleninformationen können auf Zellen- oder Tabellenebene geändert werden. Weitere Informationen zum Konfigurieren von Tabellen auf Zellenebene und auf Tabellenebene finden Sie unter Aktuelle Validation Station.

Konfigurieren von Ankern

Anker können definiert werden, sobald der Vorlageneditor über den Vorlagenmanager geöffnet wurde und sind unter den Optionen zum Auswahlmodus zu finden.

Beim Definieren oder Bearbeiten einer Vorlage auf Seitenebene (optional), muss zuerst die Auswahl von Seite 1 – Abgleichsinformationen durchgeführt werden. Dieser Schritt ist nur für feste Formvorlagen obligatorisch.

Die Auswahl zu Seite 1 – Abgleichsinformationen befindet sich auf der linken Seite des Bildschirms. Sie erfordert eine Texteingabe (tokens only are accepted (nur Token werden akzeptiert)) auf der ersten Seite der Vorlage, die sich immer an der gleichen Position innerhalb des jeweiligen Vorlagenlayouts befindet und ein eindeutiges Wort-Diagramm in alle Vorlagen bildet, die für einen bestimmten Dokumenttyp definiert sind (unter Berücksichtigung relativer Abstände und Winkel zwischen Wörtern).

Seite 1 – Abgleichsinformationen (und alle anderen Felder mit Seitenabgleichsinformationen) sind also „Fingerabdrücke“ einer bestimmten Seite und werden umfassend zur Identifizierung der richtigen Vorlage bei der Laufzeit verwendet.

Deshalb wird für das Feld Seite 1 – Abgleichsinformationen dringend empfohlen, 10 bis 20 Wörter auszuwählen, vorzugsweise länger, verteilt auf den gesamten Seitenbereich.

Die anderen Felder mit Seitenabgleichsinformationen (eines für jede Vorlagenseite) müssen nur ausgefüllt werden, wenn Sie die Extraktion von Daten aus dieser bestimmten Seite versuchen und keine vorlagenübergreifende Eindeutigkeit mehr erforderlich ist. Wenn keine Felder von einer bestimmten Seite extrahiert werden müssen, ist die Definition der Abgleichsinformationen auf Seitenebene für diese Seite nicht erforderlich.

Konfigurieren von einfachen Feldern

Für alle Felder außer Tabellen besteht das Konfigurieren der Vorlage darin, einen Benutzerdefinierten Bereich auszuwählen und ihn einem bestimmten Feld zuzuweisen.

Bei festen Formkonfigurationen können Datenfelder nur mit der Auswahl eines Benutzerdefinierten Bereichs konfiguriert werden.

Für ein beliebiges Feld können Sie einen oder mehrere dieser Benutzerdefinierten Bereiche mithilfe der Schaltfläche Hinzufügen definieren. Wenn zwei oder mehr benutzerdefinierte Bereiche für ein einzelnes Feld definiert sind (dann zur Runtime) und wenn das Feld in der Taxonomie als Einzelwert definiert ist, werden alle Werte in einen einzelnen gemeldeten Wert verkettet. Wenn das Feld als Mehrfachwert definiert ist, wird jeder Wert einzeln gemeldet.

Das Symbol neben jedem Feld gibt den Typ der unterstützten Auswahl an: Token oder Benutzerdefinierter Bereich.

Abbildung 10. Animiertes Bild, das die Typen der unterstützten Auswahl für Beispielfelder zeigt

Hinweis:

Wenn ein leerer Bereich ausgewählt wird, wird die Auswahl automatisch als Benutzerdefinierter Bereich festgelegt. Wenn Text im ausgewählten Bereich erkannt wird, werden Sie aufgefordert, den Typ der Auswahl zwischen Token oder Benutzerdefiniertem Bereich auszuwählen.

Anhand des Auswahlmodus der Validation Station können Sie Ihre Auswahl zwischen Token und benutzerdefinierten Bereichen sperren.

Konfigurieren von Tabellen

Wie oben erwähnt, gibt es Felder, in denen Informationen nur mithilfe von Token (z. B. die Felder Seite – Abgleichsinformationen) oder nur mit einem Benutzerdefinierten Bereich (z. B. einfache Felder) hinzugefügt werden können. Bei Tabellenfeldern können Sie Folgendes tun:

Definieren Sie jede Zelle einzeln, sobald der Tabellen-Editor erweitert wurde – durch Hinzufügen der Auswahl eines Benutzerdefinierten Bereichs zu jeder Zelle einzeln;
die Tabellenmarkierungsfunktion verwenden – indem Sie den Tabellenbereich markieren, Zeilen- und Spaltentrennzeichen festlegen und dann dem Feld die markierte Tabelle zuweisen. Stellen Sie sicher, dass der extrahierte Bereich die gleiche Anzahl von Spalten und Zeilen wie der Vorlagenbereich hat.

So verwenden Sie die Tabellenmarkierungsfunktion:

Wählen Sie Weitere Optionen für das Tabellenfeld aus
Wählen Sie Neue Tabelle extrahieren aus.
Wählen Sie die Tabelle aus, die Sie extrahieren möchten.
Wählen Sie für jedes Feld über jeder Tabellenspalte den Spaltennamen aus, den es darstellen soll.
Sie können auch Header extrahieren auswählen.
Wählen Sie schließlich Neue Tabelle speichern aus.

Abbildung 11. Animiertes Bild eines Beispiels zur Verwendung der Tabellenmarkierungsfunktion

Ankerkonfiguration

Eine Methode zum Definieren der Grenzen eines benutzerdefinierten Bereichs, aus dem Daten extrahiert werden sollen, ist die Verwendung von Ankern auf Feldebene. Diese ermöglichen eine gezielte Datenextraktion basierend auf Konfigurationen auf Feldebene und ermöglichen so mehr Flexibilität beim Definieren Ihrer Formularextraktionsregeln.

Daher weiß der Form Extractor zur Laufzeit, wie Folgendes auszuführen ist:

die Übereinstimmung einer Vorlage auf Seitenebene ermittelt und Informationen entsprechend der besten übereinstimmenden Vorlage auf Seitenebene extrahiert
die Übereinstimmung ankerbasierter Einstellungen ermittelt und Informationen entsprechend ihrer Anwendung im zu verarbeitenden Dokument extrahiert
entsprechende Konfidenzwerte für alle möglichen Übereinstimmungen berechnet, um das beste Ergebnis (höchste Wahrscheinlichkeit der Übereinstimmung) aller verfügbaren Optionen melden zu können.

Erstellen einer neuen Ankereinstellung

Stellen Sie sicher, dass Sie sich im Ankerauswahlmodus befinden.
Zeichnen Sie ein Feld um den Wertbereich.
Wählen Sie eine Beschriftung (Hauptanker) für Ihren Wertbereich mit einer der folgenden Methoden aus:
- Wählen Sie das erste Wort aus und verwenden Sie dann Ctrl + Selectfür das letzte Wort der Auswahl.
- Auswählen, ziehen und loslassen, um einen Wortbereich zu erfassen.
  Hinweis: Eine Beschriftung darf nur aufeinanderfolgende Wörter aus derselben visuellen Zeile enthalten.
Wählen Sie alle zusätzlichen Anker aus, die Ihre Beschriftung eindeutig identifizieren würden. Es gilt dasselbe Auswahlprinzip.
Weisen Sie Ihr Ankerkonstrukt dem entsprechenden Feld zu, indem Sie Wert extrahieren für dieses bestimmte Feld auswählen.
Abbildung 12. Beispiel zum Erstellen mehrerer Anker für ein Feld

Hinweis: Sie können auch anhand der vorherigen Beispiele auf dieser Seite erfahren, wie Sie eine Vorlage erstellen und Extraktionsbereiche und Anker definieren.

Eine vorhandene Ankereinstellung bearbeiten

Markieren Sie Ihre Ankereinstellung.
Nehmen Sie Änderungen daran vor (löschen Sie nach Bedarf alle Anker, die Beschriftung, oder den Wertbereich, fügen Sie neue Elemente hinzu usw.).
Wählen Sie Weitere Optionen für einen Feldanker aus und verwenden Sie dann die Option Extrahierten Wert ändern, um die Feldzuordnung anzupassen.
Abbildung 13. Beispiel für das Ändern des extrahierten Werts für ein Feld
Hinweis:
- Wenn Sie den Zielbereich löschen, werden alle Anker gelöscht und Sie beginnen von vorne.
- Wenn Sie die Beschriftung (Hauptanker) löschen, wird der erste Anker aus der Erstellreihenfolge zur neuen Beschriftung.

Bearbeiten einer vorhandenen Ankereinstellung

Um eine Ankereinstellung zu löschen, können Sie eine der folgenden Optionen verwenden:

Wählen Sie Weitere Optionen für einen Feldanker aus und verwenden Sie die Option Als fehlend markieren für einen gespeicherten Wert.
Abbildung 14. Beispiel für die Verwendung der Option Als fehlend markieren, um eine Ankereinstellung zu löschen
Wählen Sie Weitere Optionen für einen Feldanker aus und verwenden Sie die Option Wert entfernen im Falle einer Liste von Ankern, die für ein bestimmtes Feld definiert sind.
Abbildung 15. Beispiel für die Verwendung der Option Wert entfernen zum Löschen einer Ankereinstellung

Konfigurationen kombinieren und abgleichen

Für denselben Dokumenttyp können Sie beliebig viele Vorlagen definieren. Sie können mehrere Vorlagen auf Seitenebene, mehrere Anker für dasselbe Feld und auch Vorlagen haben, die Anker auf Seiten- und Feldebene enthalten.