Intelligente Datenextraktion und Verarbeitung (IXP) – Modelle über einen Workflow verbrauchen

ixp

latest

false

Benutzerhandbuch für Unstrukturierte und komplexe Dokumente

Überblick
Modellerstellung
Modellvalidierung
Modellbereitstellung
Verbrauchen von Modellen
- Modelle über einen Workflow verbrauchen
- Modelle über Document Understanding-API verbrauchen
API
- API-Prüfungsereignisse
Häufig gestellte Fragen
- Häufig gestellte Fragen

Wichtig :

Es kann 1–2 Wochen dauern, bis die Lokalisierung neu veröffentlichter Inhalte verfügbar ist.

Modelle über einen Workflow verbrauchen

Nutzen Sie IXP-Modellvorhersagen in UiPath Studio, indem Sie einen Workflow für die Taxonomiedefinition und Dokumentverarbeitung erstellen.

Sie können die Vorhersagen einer veröffentlichten Modellversion für unstrukturierte und komplexe Dokumente verwenden, indem Sie einen Workflow in UiPath Studio erstellen.

Überblick

Das Erstellen eines IXP-Workflows für unstrukturierte und komplexe Dokumente umfasst in der Regel folgende Schritte:

Paketinstallation
Taxonomie-Definition
Digitalisierung der Dokumente
Dokumentklassifizierung
Dokumentextrahierung
Dokumentvalidierung

Hinweis:

Der Schritt zur Taxonomie-Definition gilt nur für Windows-Projekte, nicht für plattformübergreifende Projekte. Um die Unterschiede zwischen den Projekttypen zu erfahren, lesen Sie die folgenden Abschnitte.

Voraussetzungen

Sie müssen ein Modell haben, das in einem Projekt für unstrukturierte und komplexe Dokumente veröffentlicht wurde.

Wenn Sie mit der Erstellung Ihres Studio-Workflows beginnen, müssen Sie entscheiden, welchen Typ von Projekt Sie ausführen möchten: Windows oder plattformübergreifend. Jeder Projekttyp erfordert unterschiedliche Pakete.

Unabhängig vom ausgewählten Projekttyp können Sie die Pakete installieren:

Automatisch – Verwenden Sie die Document Understanding-Prozessvorlage. Weitere Informationen zum Suchen und Installieren von Vorlagen in Studio finden Sie unter Projektvorlagen.
Manuell – Weitere Informationen finden Sie unter Installieren von Paketen. Wenn Sie die Pakete manuell installieren, stellen Sie sicher, dass Sie je nach Projekttyp die folgenden Versionen oder neuere Versionen installieren:

Windows

UiPath.IntelligentOCR.Activities 6.22.0
UiPath.System.Activities 24.10.6

Plattformübergreifend

UiPath.DocumentUnderstanding.Activities 2.12.0
UiPath.System.Activities 24.10.6

Hinweis:

Das IntelligentOCR-Paket ist mit Windows-Projekten kompatibel, nicht mit plattformübergreifenden Projekten.
Sie können plattformübergreifende Workflows erstellen und andere Vorlagen in Studio Web verwenden.

Erstellen eines IXP-Workflows für Windows-Projekte.

Die folgenden Abschnitte enthalten die Schritte, die angewendet werden müssen, wenn Sie keine der Studio-Vorlagen verwenden und von vorne beginnen.

Um einen IXP-Workflow für Windows-Projekte zu erstellen, gehen Sie wie folgt vor:

Hinweis:

Die in den folgenden Abschnitten verwendeten Variable sind nur Beispiele.Sie können Ihre Variablen gemäß Ihren eigenen Konventionen benennen.

1. Installieren der Pakete

Stellen Sie sicher, dass Sie die im Abschnitt „Voraussetzungen“ genannten Pakete installieren.

2. Definieren der Taxonomie

In Studio Desktop einen Basisprozess erstellen.
Wählen Sie bei der Konfiguration Ihres Prozesses im Feld Kompatibilität den Workflowtyp aus, den Sie erstellen möchten: Windows oder plattformübergreifend. Weitere Informationen finden Sie unter Über Automatisierungsprojekte.
Öffnen Sie den Taxonomiemanager auf der Registerkarte „Design“ und richten Sie Ihre Tabellenfelder wie folgt ein:
- Erstellen Sie ein Tabellenfeld für jede Feldgruppe in Ihrer IXP-Projekt-Taxonomie.
- Fügen Sie im jeweiligen Tabellenfeld für jedes in der Feldgruppe definierte Feld eine Spalte hinzu.
Hinweis:
Taxonomiemanager:
- Unterstützt das Erstellen von Tabellen und Feldern. Wenn Sie IXP-Workflows für unstrukturierte und komplexe Dokumente erstellen, wird empfohlen, Tabellenfelder anstelle von einfachen Feldern zu erstellen.
- ist nur verfügbar, wenn das IntelligentOCR Paket installiert ist. Das bedeutet, dass es nur für Windows-Projekte verfügbar ist, nicht plattformübergreifend.
Als nächstes müssen Sie einen Speicherort haben, an dem Sie Dokumente lesen können. Erstellen Sie beispielsweise im Projektordner einen neuen Ordner mit dem Namen Dokumente und fügen Sie einige Dateien hinzu.
Fügen Sie in der Sequence eine Assign-Aktivität hinzu, um anzugeben, aus welcher Quelle Dokumente gelesen werden sollen. Konfigurieren Sie die folgenden Felder:
- Speichern unter – Erstellen und fügen Sie eine Variable vom Typ System.String[] hinzu. In diesem Beispiel heißt die Variable „docs“.
- Zu speichernder Wert – HinzufügenDirectory.GetFiles("./documents")
Fügen Sie eine Load Taxonomy-Aktivität hinzu, um die konfigurierte Taxonomie in einer Variable zu speichern, um im Rest der Automatisierung darauf zu verweisen.Erstellen und fügen Sie eine Variable vom Typ „DocumentTaxonomy“ hinzu. In diesem Beispiel heißt die Variable „taxo“.

Hinweis:
Sie müssen die Variable der Ausgabe der Aktivität zuordnen.

3. Digitalisieren eines Dokuments

Fügen Sie eine For Each-Aktivität hinzu, um jedes Dokument zu durchlaufen.Fügen Sie für die Eingabe die Variable docs hinzu, die Sie zuvor erstellt haben.
Ziehen Sie die folgende Aktivität innerhalb von „For Each“ und legen Sie sie ab:
- Dokument digitalisieren – Ermöglicht Ihnen, die von Ihnen bereitgestellten Dokumente zu lesen und die Ausgabe des Document Object Model (DOM) abzurufen. Konfigurieren Sie die folgenden Felder:
  - Dokumentpfad – Fügen Sie die Variable „doc“ hinzu. Sie finden die Variable im Elementnamen, den Sie in der Aktivität „For Each“ konfiguriert haben. In diesem Beispiel ist der Elementname „doc“ und stellt den Dateipfad des Dokuments dar, das Sie digitalisieren möchten.
  - Dokumenttext – Erstellen und fügen Sie die Variable Text hinzu.
  - Document Object Model (DOM) – Erstellen und fügen Sie die Variable dom hinzu.

4. Klassifizieren eines Dokuments

Ziehen Sie in derselben For Each-Aktivität nach Digitize Document die folgende Aktivität per Ziehen und Ablegen:

„Scope“ klassifizieren – Ermöglicht Ihnen die Klassifizierung des verarbeiteten Dokuments in einen der definierten Dokumenttypen in Ihrer Taxonomie.Fügen Sie für die Eingaben Folgendes hinzu:
- Dokumentpfad – Fügen Sie die Variable doc hinzu.
- Dokumenttext – Fügen Sie die Textvariable hinzu.
- Document Object Model (DOM) – Fügen Sie die Variable „DOM“ hinzu.
- Taxonomie - Fügen Sie die Taxonomie-Variable hinzu. Fügen Sie für die Ausgaben Folgendes hinzu:
- Klassifizierungsergebnisse – Erstellen und fügen Sie eine neue Variable ClassificationResults hinzu.

Fügen Sie im „Scope“ die Aktivität „Generative Klassifizierer“ hinzu, um Dokumente mit generativen Modellen zu klassifizieren.Konfigurieren Sie die Aktivität wie folgt:

Select Manage Field Details.
In the Document Type column, select a document type.
In the Field Details column, add an optional value to define additional details about the document type. This can be a short description of the document type. The maximum number of characters allowed is 1000.
Wählen Sie Speichern.

Hinweis:

Eine Klassifizierungsaktivität ist optional, wenn Sie nur einen Dokumenttyp in Ihrer Taxonomie- haben.Sie können die Dokumenttyp-ID kopieren und als Eingabe für die Aktivität Data Extraction Scope verwenden.

5. Extrahieren von Details aus einem Dokument

Ziehen Sie die folgende Aktivität innerhalb von „For Each“ und legen Sie sie ab:
- Scope der Datenextraktion – Ermöglicht Ihnen das Konfigurieren von Extraktor-Aktivitäten. Fügen Sie für die Eingaben Folgendes hinzu:
  - Dokumentpfad – Fügen Sie die Variable doc hinzu.
  - Dokumenttext – Fügen Sie die Variable Text hinzu.
  - Document Object Model (DOM) – Fügen Sie die Variable dom hinzu.
  - Taxonomie – Fügen Sie die Variable Taxo hinzu.
  - Klassifizierungsergebnis – Fügen Sie die Variable „ClassificationResults“ hinzu. Fügen Sie für die Ausgabe Folgendes hinzu:
  - Extraktionsergebnisse – Erstellen und fügen Sie eine neue Variable ExtractionResults hinzu.
Fügen Sie innerhalb des Data Extraction Scope die Aktivität „Document Understanding Project Extractor“ hinzu, um die Dokumentdaten zu extrahieren.

Wenn Sie die Aktivität „Projektextraktor“ innerhalb des Scope hinzufügen, sollte das Konfigurationsfenster „Funktionen abrufen“ automatisch geöffnet werden.

Wenn das veröffentlichte Projekt in einer anderen Organization oder einem anderen Mandanten gehostet wird oder in einer Hybridkonfiguration verwendet wird, fügen Sie die erforderlichen Details unter „Funktionen abrufen“ wie folgt hinzu:
- Erstellen Sie eine externe Anwendung auf der Seite Admin in Automation Cloud. Weitere Einzelheiten dazu finden Sie unter Hinzufügen einer externen Anwendung.
- Kopieren Sie die App-ID und das App-Geheimnis, wobei das App-Geheimnis das Kennwort ist.
- Erstellen Sie ein Orchestrator-Anmeldeinformations-Asset.
- Fügen Sie im Fenster „Funktionen abrufen“ die Anmeldeinformationen, die Anwendungs-ID und das Geheimnis hinzu.
- Konfigurieren Sie die restlichen Felder wie in Document Understanding Project Extractor beschrieben.
  
  Hinweis:
  Wenn Sie die Mandanten-URL kopieren, stellen Sie sicher, dass sie die Namen der Organization und des Mandanten enthält.Zum Beispiel, https://staging.uipath.com/communicationsminingteam/IXPTesting${DNT_1}, wo communicationsminingteam${DNT_2} die Organization ist und IXPTesting${DNT_3} der Mandant.
- Fügen Sie in der Aktivität „Document Understanding Project Extractor“ den Asset-Pfad als Eingabe in die Asset-Eigenschaft „Runtime Credentials Asset“ der Aktivität „Document Understanding Project Extractor“ hinzu. Der Pfad sollte in Form von <OrchestratorFolderName>/<AssetName> sein.
Wenn der Workflow in derselben Organisation und demselben Mandanten ausgeführt wird, in der das Projekt veröffentlicht wurde, wählen Sie das veröffentlichte Projekt in der Aktivität „Document Understanding Project Extractor“ aus.

Hinweis:
Das veröffentlichte Modell wird in den Dropdownoptionen angezeigt, wenn Studio mit derselben Organization oder demselben Mandanten verbunden ist, in dem das Modell veröffentlicht wurde.Wenn das Modell nicht angezeigt wird, kann dies daran liegen, dass es in einer anderen Organisation oder einem anderen Mandanten veröffentlicht wurde.Wenden Sie in diesem Fall die Anweisungen aus dem folgenden Abschnitt „Nutzung von Vorhersagen aus organisationsübergreifenden, mandantenübergreifenden oder hybriden Projekten“ an.
Wählen Sie Extraktoren konfigurieren aus und verwenden Sie den Assistenten, um Ihre Taxonomie den Feldern zuzuordnen, die im Projekt „Unstrukturierte und komplexe Dokumente“ definiert sind.Abbildung 1. Der Studio-Assistent zum Konfigurieren von Extraktoren

6. Validieren eines Dokuments

Optional können Sie Entscheidungskriterien konfigurieren, um festzustellen, ob eine menschliche Validierung für die Ausgabe der Klassifizierung erforderlich ist.Dies kann mithilfe benutzerdefinierter Geschäftsregeln oder einer Nachverarbeitungslogik erfolgen. Sie können in einem Workflow auch benutzerdefinierte Entscheidungskriterien verwenden, um eine Validierung auszulösen, oder Konfidenzschwellenwerte auf Feldebene festlegen.Dieses Entscheidungskriterium hängt von den Geschäftsprozessanforderungen und der Zulassung Ihres Anwendungsfalls für falsch-positive Ergebnisse ab, dh Ergebnisse, die eine menschliche Validierung überspringen, aber falsch extrahiert wurden.Basierend auf diesen Regeln können Sie Steuerelemente verwenden, um zu bestimmen, ob ein Dokument automatisch validiert oder an eine menschliche Validierung weitergeleitet wird.Weitere Informationen finden Sie im Abschnitt Validierungseinstellungen unter Überprüfen der Struktur.

Fügen Sie die Aktivität „Present Validation Station“ hinzu, um in der Validierungsstation zu validieren. Die Ausgabe ExtractionResults der Aktivität Data Extraction Scope wird als Eingabe für die Aktivität Present Validation Station verwendet.Fügen Sie für die Eingabe die Variable ExtractionResults hinzu. Erstellen und fügen Sie für die Ausgabe eine neue Variable ValidatedExtractionResults hinzu.
Fügen Sie für die Eingaben Folgendes hinzu:
- Dokumentpfad – Fügen Sie die Variable doc hinzu.
- Dokumenttext – Fügen Sie die Variable Text hinzu.
- Document Object Model (DOM) – Fügen Sie die Variable dom hinzu.
- Taxonomie – Fügen Sie die Variable Taxo hinzu.
- Automatische Extraktionsergebnisse – Fügen Sie die Variable ExtractionResults hinzu.
Fügen Sie für die Ausgabe Folgendes hinzu:
- Validierte Extraktionsergebnisse – Erstellen und fügen Sie eine neue Variable ValidatedExtractionResults hinzu.

In diesem Validierungsschritt können Sie auch andere Aktivitäten als Present Validation Station verwenden.Zum Beispiel:

Erstellen Sie Validierungsartefakte oder eine App-Aufgabe erstellen, wenn Sie Apps haben, die die Komponente „Inhaltsvalidierung“ verwenden.
Erstellen Sie eine Dokumentvalidierungsaktion oder warten Sie auf eine Dokumentvalidierungsaktion und Fortsetzen, wenn Sie die Validierungsstation an Action Center senden möchten.

Weitere Informationen zur Validierung aktivieren Sie in den folgenden Ressourcen:

Validierungsstation
Apps
- Validieren von Dokumenten mit App-Aktionen

Auslösen der menschlichen Validierung

Die menschliche Validierung der Klassifizierungsausgabe wird ausgelöst, indem nach dem Klassifizierungsschritt eine Entscheidungslogik angewendet wird, bevor der Workflow mit der Extraktion fortfährt. Die Entscheidung erfolgt standardmäßig nicht automatisch, sondern wird explizit über Konfidenzschwellenwerte und Geschäftsregeln gesteuert, die im Workflow definiert sind.

Die folgende Liste zeigt, wie die menschliche Validierung ausgelöst werden kann:

Jedes Klassifizierungsergebnis enthält Konfidenzbewertungen, die angeben, wie sicher das Modell über den vorhergesagten Dokumenttyp ist.Diese Bewertungen werden im Workflow ausgewertet, um festzustellen, ob die Klassifizierung zuverlässig ist.
KonfidenzschwellenSie können einen Mindestkonfidenzschwellenwert für die Klassifizierung definieren.Wenn der Konfidenzwert für den vorhergesagten Dokumenttyp unter diesen Schwellenwert liegt, wird die Klassifizierung als unsicher angesehen und das Dokument wird zur menschlichen Validierung gekennzeichnet.
Geschäftsregeln und bedingte Logik Zusätzlich zu Konfidenzschwellen können Sie benutzerdefinierte Geschäftsregeln anwenden, z. B.
- Bestimmte Dokumenttypen, die immer manuell überprüft werden müssen.
- Abweichungen zwischen erwarteten und vorhergesagten Dokumenttypen.
- Regeln, die darauf basieren, wie das Dokument später verarbeitet wird. Zum Beispiel Dokumente, die vor der Extraktion oder Genehmigung verifiziert werden müssen.
Auslösen des Validierungsschritts Wenn die definierten Kriterien erfüllt sind, leitet der Workflow das Dokument an einen menschlichen Validierungsschritt weiter, indem er einen der Validierungsmechanismen aufruft:
- Present Validation Station für die In-Robot-Validierung.
- Create Validation Task für eine Action Center-basierte Validierung.
- Create Document Validation Artifacts für die Validierung in Apps.
Menschliche Bestätigung oder KorrekturWährend der Validierung bestätigt oder korrigiert der menschliche Prüfer den Dokumenttyp. Das validierte Klassifizierungsergebnis wird dann für nachfolgende Schritte wie die Datenextraktion verwendet, um sicherzustellen, dass die nachgelagerte Verarbeitung auf einem genehmigten Dokumenttyp basiert. Zusammenfassend wird die menschliche Validierung für die Klassifizierung durch Workflow-gesteuerte Regeln ausgelöst, die in der Regel auf Konfidenzbewertungen und Geschäftslogik basieren und bestimmen, wann ein Klassifizierungsergebnis eine manuelle Überprüfung erfordert, bevor der Prozess fortgesetzt wird.

Interpretation der Ergebnisse der Validierungsstation aus IXP-Modellen

Bei Verwendung von Workflows, die Modelle für unstrukturierte und komplexe IXP-Dokumente nutzen, dient die Validierungsstation als wichtige Schnittstelle für die Überprüfung, Bestätigung und Optimierung der extrahierten Daten.Die Validierungsstation zeigt, wie das Modell das Dokument interpretiert hat, sodass Sie die Extraktionsgenauigkeit verstehen, unsichere Bereiche identifizieren und gegebenenfalls Korrekturen vornehmen können.

In der Validierungsstation werden der Dokumenttyp und die zugehörigen Felder zusammen mit den extrahierten Werten und Konfidenzindikatoren angezeigt. Weitere Details zum Validierungsprozess finden Sie in den folgenden Ressourcen:

Vergleich von Workflows in Windows- und plattformübergreifenden Projekten

Die folgende Tabelle zeigt einen Vergleich der IXP-Workflows für Windows und plattformübergreifende Projekte:

	Windows	Plattformübergreifend
Erforderliche Pakete	IntelligentOCR	Document Understanding
Definieren der Taxonomie	Mit der Option Taxonomiemanager können Sie die Liste der Felder definieren, die in der Validierungsstation angezeigt oder in das Extraktionsergebnisobjekt aufgenommen werden. Hinweis: Der Taxonomiemanager ist nur verfügbar, wenn das Paket Intelligent OCR installiert ist.	Das Document Understanding-Paket liest und zeigt automatisch die im IXP-Modellschema definierten Felder an.Diese Felder werden nicht über den Workflow konfiguriert.

War diese Seite hilfreich?

Vorherige (previous)CLI

WeiterModelle über Document Understanding-API verbrauchen

Überblick​

Voraussetzungen​

Windows​

Plattformübergreifend​

Erstellen eines IXP-Workflows für Windows-Projekte.​

1. Installieren der Pakete​

2. Definieren der Taxonomie​

3. Digitalisieren eines Dokuments​

4. Klassifizieren eines Dokuments​

5. Extrahieren von Details aus einem Dokument​

6. Validieren eines Dokuments​

Auslösen der menschlichen Validierung​

Interpretation der Ergebnisse der Validierungsstation aus IXP-Modellen​

Vergleich von Workflows in Windows- und plattformübergreifenden Projekten​

War diese Seite hilfreich?

Überblick

Voraussetzungen

Windows

Plattformübergreifend

Erstellen eines IXP-Workflows für Windows-Projekte.

1. Installieren der Pakete

2. Definieren der Taxonomie

3. Digitalisieren eines Dokuments

4. Klassifizieren eines Dokuments

5. Extrahieren von Details aus einem Dokument

6. Validieren eines Dokuments

Auslösen der menschlichen Validierung

Interpretation der Ergebnisse der Validierungsstation aus IXP-Modellen

Vergleich von Workflows in Windows- und plattformübergreifenden Projekten