Aktivitäten – Data Extraction Scope

activities

latest

false

Document Understanding-Aktivitäten

Wichtig :

Bitte beachten Sie, dass dieser Inhalt teilweise mithilfe von maschineller Übersetzung lokalisiert wurde. Es kann 1–2 Wochen dauern, bis die Lokalisierung neu veröffentlichter Inhalte verfügbar ist.

Datenextraktionsumfang

Aktivität Data Extraction Scope, die einen Scope für Extraktoraktivitäten bietet, die für durch Taxonomie definierte Dokumenttypen konfiguriert sind.

UiPath.IntelligentOCR.Activities.DataExtraction.DataExtractionScope

Beschreibung

Stellt einen Bereich für Extraktionsaktivitäten zur Verfügung, mit dem Sie diese entsprechend den in Ihrer Taxonomie definierten Dokumenttypen konfigurieren können. Die Ausgabe der Aktivität ist in einer ExtractionResult-Variablen gespeichert, die alle automatisch extrahierten Daten enthält und als Eingabe für die Aktivität Extraktionsergebnisse exportieren (Export Extraction Results) verwendet werden kann. Diese Aktivität bietet überdies einen Assistenten zum Konfigurieren von Extraktionen, mit dem Sie genau angeben können, welche Felder aus den in der Taxonomie definierten Dokumenttypen Sie genau extrahieren möchten.

Projektkompatibilität

Windows – Legacy | Windows

Konfiguration

Designer-Panel

Eingabe

Dokumentpfad (DocumentPath) - Der Pfad zu dem Dokument, das Sie validieren möchten. Dieses Feld unterstützt nur Strings und Variablen des Typs String.
Hinweis:
Die unterstützten Dateitypen für dieses Eigenschaftsfeld sind .png, .gif, .jpe, .jpg, .jpeg, .tiff, .tif, .bmp und .pdf.
Dokumenttext - Der Text des Dokuments, gespeichert in einer String-Variablen. Dieser Wert kann mit der Aktivität Dokument digitalisieren abgerufen werden. Weitere Informationen dazu finden Sie unter Digitize Document . Dieses Feld unterstützt nur Strings und String -Variablen.
Dokumentobjektmodell – Das Dokumentobjektmodell, gegen das Sie das Dokument validieren möchten. Dieses Modell ist in einer Document -Variablen gespeichert und kann mit der Aktivität Dokument digitalisieren abgerufen werden. Weitere Informationen dazu finden Sie unter Digitize Document . Dieses Feld unterstützt nur Document -Variablen.
Taxonomie - Die Taxonomie, gegen die das Dokument verarbeitet werden soll, gespeichert in einer DocumentTaxonomy -Variablen. Dieses Objekt können Sie durch eine Aktivität Load Taxonomy erhalten. Dieses Feld unterstützt nur DocumentTaxonomy -Variablen.
Klassifizierungsergebnisse (ClassificationResults) - Die Ergebnisse der Ausführung einer Klassifizierungsaktivität für das angegebene Dokument, gespeichert in einem ClassificationResult-Objekt. Dieses Feld ist optional, wenn Sie stattdessen eine Dokumenttyp-ID (DocumentTypeId) angeben. Dieses Feld unterstützt nur ClassificationResult-Variablen.
DokumentTypID – Die Dokumenttyp-ID, wie sie im Taxonomiemanager zu finden ist. Dieses Feld ist optional, wenn Sie eine Datei im Feld Klassifizierungsergebnisse angeben. Dieses Feld unterstützt nur Strings und String-Variablen.

Ausgabe

Extraktionsergebnisse (ExtractionResults) - Die Extraktionsergebnisse des Datenextraktionssprozesses, gespeichert in einer ExtractionResult-Variablen.
Hinweis:
If the page range for data extraction indicates that only a part of the original file is targeted, the Data Extraction Scope generates a file in the TEMP project folder that is then passed to the extractors. The temporary file contains only the page range that extractors should receive for document processing.

Eigenschaften-Panel

Authentication

Mit den Authentifizierungseigenschaften dieser Aktivität können Sie die automatische Validierung über lokale Roboter durchführen. Bevor Sie diese Eigenschaften konfigurieren, stellen Sie sicher, dass Sie die auf der Seite Konfigurieren der Authentifizierung genannten Voraussetzungen erfüllt haben. Nachdem diese Schritte abgeschlossen sind, können Sie mit dem Ausfüllen der Authentifizierungseigenschaften der Aktivität fortfahren.

Runtime-Anmeldeinformationen-Asset – Verwenden Sie dieses Feld, wenn Sie auf die automatischen Validierungsfunktionen von Document Understanding zugreifen müssen, während der Roboter mit einem lokalen Orchestrator oder von einem anderen Mandanten aus verbunden ist. Sie können ein Asset mit Zugangsdaten zu Authentifizierungszwecken auf eine der folgenden Arten eingeben:
- Wählen Sie in der Dropdownliste das gewünschte Anmeldeinformations-Asset vom Orchestrator aus, mit dem der UiPath®-Roboter verbunden ist.
- Geben Sie den Pfad zum Orchestrator-Anmeldeinformationen-Asset, in dem Sie die Anmeldeinformationen der externen Anwendung für den Zugriff auf die automatischen Validierungsfunktionen speichern, manuell ein.
  
  Das Format des Pfads sollte <OrchestratorFolderName>/<AssetName> sein.
Runtime-Mandanten-URL – Verwenden Sie dieses Feld neben dem Feld Runtime-Anmeldeinformationen-Asset . Geben Sie die URL des Mandanten ein, mit dem sich der Roboter verbindet, um die automatische Validierung auszuführen. Die URL muss das folgende Format haben: https://<baseURL>/<OrganizationName>/<TenantName>.

Allgemein

AnzeigeName (DisplayName) - Der Anzeigename der Aktivität.

Eingabe

AutoValidierungAnwenden – Passen Sie die Konfidenz mithilfe der Gegenprüfung der generativen Extraktion an. Wenn Werte automatisch validiert werden, wird die Konfidenz dieser Werte auf den Konfidenzschwellenwert festgelegt. Die Aktivierung dieser Funktion führt zu einem zusätzlichen Verbrauch von AI Units.
Klassifizierungsergebnisse (ClassificationResults) - Die Ergebnisse der Ausführung einer Klassifizierungsaktivität für das angegebene Dokument, gespeichert in einem ClassificationResult-Objekt. Dieses Feld ist optional, wenn Sie stattdessen eine Dokumenttyp-ID (DocumentTypeId) angeben. Dieses Feld unterstützt nur ClassificationResult-Variablen.
Dokumentobjektmodell – Das Dokumentobjektmodell, gegen das Sie das Dokument validieren möchten. Dieses Modell ist in einer Document -Variablen gespeichert und kann mit der Aktivität Dokument digitalisieren abgerufen werden. Weitere Informationen dazu finden Sie unter Digitize Document . Dieses Feld unterstützt nur Document -Variablen.
Dokumentpfad (DocumentPath) - Der Pfad zu dem Dokument, das Sie validieren möchten. Dieses Feld unterstützt nur Strings und Variablen des Typs String.
Hinweis:
Die unterstützten Dateitypen für dieses Eigenschaftsfeld sind .png, .gif, .jpe, .jpg, .jpeg, .tiff, .tif, .bmp und .pdf.
Dokumenttext - Der Text des Dokuments, gespeichert in einer String-Variablen. Dieser Wert kann mit der Aktivität Dokument digitalisieren abgerufen werden. Weitere Informationen dazu finden Sie unter Digitize Document . Dieses Feld unterstützt nur Strings und String -Variablen.
DokumentTypID – Die Dokumenttyp-ID, wie sie im Taxonomiemanager zu finden ist. Dieses Feld ist optional, wenn Sie eine Datei im Feld Klassifizierungsergebnisse angeben. Dieses Feld unterstützt nur Strings und String-Variablen.
FormatWerteWennMöglich – Gibt an, dass ein Wert, der abgeleitete Teile gemeldet hat, nicht vom Datenextraktions-Scope überschrieben wird, aber wenn er keine abgeleiteten Teile enthält, versucht der Datenextraktions-Scope, ihn zu berechnen. Wenn die Option auf False festgelegt ist, werden die Werte nicht formatiert.
AutomatischeValidierungKonfidenzschwellenwert – Konfidenzschwellenwert für die generative Validierung. Nur Feldwerte mit einer Konfidenz unter diesem Schwellenwert werden validiert. Wenn Werte bestätigt werden, wird die Konfidenz dieser Werte auf diesen Schwellenwert festgelegt.
Taxonomie - Die Taxonomie, gegen die das Dokument verarbeitet werden soll, gespeichert in einer DocumentTaxonomy -Variablen. Dieses Objekt können Sie durch eine Aktivität Load Taxonomy erhalten. Dieses Feld unterstützt nur DocumentTaxonomy -Variablen.

Sonstiges

Privat (Private) - Bei Auswahl werden die Werte von Variablen und Argumenten nicht mehr auf der Stufe Verbose protokolliert.

Ausgabe

Extraktionsergebnisse (ExtractionResults) - Die Extraktionsergebnisse des Datenextraktionssprozesses, gespeichert in einer ExtractionResult-Variablen.
Hinweis:
If the page range for data extraction indicates that only a part of the original file is targeted, the Data Extraction Scope generates a file in the TEMP project folder that is then passed to the extractors. The temporary file contains only the page range that extractors should receive for document processing.

Verwenden des Assistenten zum Konfigurieren des Extraktors

The Configure Extractors Wizard can be accessed via the Data Extraction Scope and allows you to choose which extractors are applied to each document type and field.

Wählen Sie im Hauptteil der Aktivität Extraktoren konfigurieren aus. Die Schaltfläche für den Assistenten wird verfügbar, nachdem Sie mindestens eine Extraktoraktivität in den Hauptteil der Aktivität Data Extraction Scope gezogen haben. Dieser Assistent zeigt alle in der Taxonomie definierten Dokumenttypen und ihre jeweiligen Felder an und ermöglicht Ihnen, auszuwählen, welchen Extraktor Sie jeweils verwenden möchten.

Abbildung 1. Übersicht über den Assistenten Extraktoren konfigurieren

Jeder Dokumenttyp kann erweitert werden und seine Felder können im Assistenten angezeigt und zum Extrahieren ausgewählt werden.

Abbildung 2. Die Auswahl eines Extraktors für einen Dokumenttyp im Assistenten „Extraktoren konfigurieren“.

Das Feld Framework-Alias kann verwendet werden, um einen Extraktor einem oder mehreren Trainern zuzuordnen. Sie können z. B. einem Machine Learning Extractor das Alias R2D2 geben und dann dasselbe Alias für einen Machine Learning Extractor Trainer verwenden . Dadurch wird eine Verbindung zwischen dem Extraktor und dem Trainer erstellt. Es dient für Trainingszwecke für den Extraktor. Jeder Extraktor hat ein eindeutiges Alias, während mehrere Trainer dasselbe Alias haben können.

Sie können das Feld Mindestkonfidenz so konfigurieren, dass ein Konfidenzschwellenwert zwischen 0 und 100 zugelassen wird. Der vorhergesagte Wert für ein Feld wird nur berücksichtigt, wenn der Konfidenzwert der Vorhersage gleich oder höher als die konfigurierte Mindestkonfidenz ist. Wenn der Konfidenzwert einer Vorhersage kleiner als der Mindestkonfidenzschwellenwert ist, wird der vorhergesagte Wert nicht in der Ausgabe der Aktivität „Data Extraction Scope“ gespeichert.

Tipp:

Sie können ein optimales Konfidenzniveau ermitteln, indem Sie verschiedene Dokumente in Ihrem Workflow testen, die Ergebnisse beispielsweise in einer Excel-Kalkulationstabelle aufzeichnen und dann analysieren, welcher Schwellenwert am genauesten ist.

Wählen Sie für die Extraktoren, die diese Funktionalität unterstützen, Extraktor-Funktionen abrufen oder aktualisieren aus. So können Sie Ihre Taxonomiefelder einfach den verfügbaren Extraktorfeldern zuordnen oder sie aktualisieren, falls sich die Extraktorfelder geändert haben.

Wenn die Kontrollkästchen neben jedem Feld in einer beliebigen Spalte aktiviert sind, wird bewirkt, dass der Data Extractor Scope dieses bestimmte Feld vom Extraktor anfordert. Wenn das Kontrollkästchen deaktiviert ist, fordert Data Extractor Scope keinen Wert für dieses Feld vom Extraktor an.

Texteingaben neben jedem Feld ermöglichen Ihnen, in Ihrer Taxonomie definierte Felder etwaigen in der internen Taxonomie der Extraktion definierten Feldern zuzuordnen. Fügen Sie bei regulären Feldern in der Texteingabe den Bezeichner des Zielfelds aus der internen Taxonomie des Extraktors hinzu. Bei Tabellenfeldern wird das übergeordnete Tabellenfeld auf Tabellenebene zugeordnet und die entsprechenden Spalten werden einzeln zugeordnet.

Hinweis:

Wenn Sie den Machine Learning Extractor in einer Einrichtung mit definierten Spaltenfeldern verwenden, können diese einem Tabellenfeld aus Ihrer Taxonomie zugeordnet werden. Sie werden unter einer Sammlung namens Elemente angezeigt.

Die Anzahl der Spalten im Assistenten hängt von der Anzahl der Extraktoren in der Scope-Aktivität ab. Der Name jeder Spalte wird durch den Anzeigenamen jeder Extraktoraktivität angegeben.

Abbildung 3. Mehrere Extraktoren im Assistenten zum Konfigurieren von Extraktoren vorhanden

Wenn mehrere Extraktoren in der Aktivität verwendet werden, definiert die Reihenfolge der Extraktoren im Scope ihre Priorität. Betrachten wir zum Beispiel drei Extraktoren. Wenn Extraktor 1 einen akzeptablen Wert (über der Mindestkonfidenz) für ein bestimmtes angefordertes Feld zurückgibt, wird dieses Feld nicht angefordert, wenn Extraktor 2 und Extraktor 3 ausgeführt werden. Wenn Extraktor 1 und Extraktor 2 Werte unterhalb der Mindestkonfidenz für das bestimmte Feld zurückgeben oder überhaupt nichts zurückgeben, werden die Ergebnisse von Extraktor 3 berücksichtigt, sofern sie die Bedingungen für die Konfidenzakzeptanz erfüllen.

Document Understanding-Integration

Die Aktivität Data Extraction Scope ist Teil der Document Understanding-Lösungen. Weitere Informationen finden Sie im Document Understanding-Leitfaden .

Auf dieser Seite

Beschreibung
Projektkompatibilität
Konfiguration
Designer-Panel
Eigenschaften-Panel
Verwenden des Assistenten zum Konfigurieren des Extraktors
Document Understanding-Integration

War diese Seite hilfreich?

Vorherige (previous)Intelligent Keyword Classifier Trainer

WeiterDocument Understanding-Projektextraktor

Beschreibung​

Projektkompatibilität​

Konfiguration​

Designer-Panel​

Eingabe​

Ausgabe​

Eigenschaften-Panel​

Authentication​

Allgemein​

Eingabe​

Sonstiges​

Ausgabe​

Verwenden des Assistenten zum Konfigurieren des Extraktors​

Document Understanding-Integration​

War diese Seite hilfreich?

Beschreibung

Projektkompatibilität

Konfiguration

Designer-Panel

Eingabe

Ausgabe

Eigenschaften-Panel

Authentication

Allgemein

Eingabe

Sonstiges

Ausgabe

Verwenden des Assistenten zum Konfigurieren des Extraktors

Document Understanding-Integration