Document Understanding
2022.4
False
Bannerhintergrundbild
Document Understanding-Benutzerhandbuch.
Letzte Aktualisierung 13. März 2024

Extrahieren von Daten aus Belegen

Wichtig:

Das Ziel dieser Seite ist es, neuen Benutzern zu helfen, sich mit Document Understanding vertraut zu machen.

Für skalierbare Produktionsbereitstellungen wird dringend empfohlen, den Document Understanding-Prozess zu verwenden, der in UiPath Studio im Abschnitt „Vorlagen“ zu finden ist.

Diese Schnellstartanleitung zeigt Ihnen, wie Sie Daten aus Belegen unter Verwendung des ML-Modells Receipts mit dem entsprechenden öffentlichen Endpunkt extrahieren können.

Die Validierung kann entweder durch Präsentieren der Validation Station oder mithilfe der Validation Action im Action Center erfolgen. Beide Optionen werden in den folgenden Abschnitten beschrieben.

Verwenden des ML-Modells „Receipts“ mit „Öffentlicher Endpunkt“ und Validation Station

In diesem Abschnitt validieren wir die Extraktionsergebnisse mithilfe der Validation Station.

Um einen einfachen Workflow mit dem ML-Modell Receipts zu erstellen, führen Sie die folgenden Schritte aus.

  1. Einen leeren Prozess erstellen
  2. Die erforderlichen Aktivitätspakete installieren
  3. Taxonomie erstellen
  4. Das Dokument digitalisieren
  5. Die Daten mit dem ML-Modell für Belege (Receipts) extrahieren
  6. Die Ergebnisse mithilfe der Validation Station validieren
  7. Die Extraktionsergebnisse exportieren

Sehen wir uns nun jeden Schritt im Detail an.

1. Einen leeren Prozess erstellen

Starten Sie UiPath Studio.

Klicken Sie in der START-Backstage-Ansicht auf Prozess, um ein neues Projekt zu erstellen.

Das Fenster Neuer leerer Prozess wird angezeigt. Geben Sie in diesem Fenster einen Namen für das neue Projekt ein. Wenn Sie möchten, können Sie auch eine Beschreibung eingeben, um Ihre Projekte einfacher auffindbar zu machen.

Klicken Sie auf Erstellen. Das neue Projekt wird in Studio geöffnet.

2. Die erforderlichen Aktivitätspakete installieren

Installieren Sie über die Schaltfläche Pakete verwalten im Menüband neben den standardmäßig zum Projekt hinzugefügten Kern-Aktivitätenpaketen (UiPath.Excel.Activities, UiPath.Mail.Activities, UiPath.System.Activities, UiPath.UIAutomation.Activities) die folgenden Aktivitätspakete:

3. Taxonomie erstellen

Sobald die Aktivitätspakete installiert sind, listen Sie die erforderlichen Felder auf. Das ML-Modell Receipts unterstützt die Datenextraktion für die folgenden Felder:

  • name (Name) – Text
  • vendor-addr (Lieferantenadresse) – Adresse
  • total (gesamt) – Zahl
  • date (Datum) – Datum
  • phone (Telefonnummer) – Text
  • currency (Währung) – Text
  • expense-type (Ausgabentyp) – Text
  • items (Posten) – Tabelle
    • description (Beschreibung) – Text
    • line-amount (Zeilensumme) – Zahl
    • unit-price (Stückpreis) – Zahl
    • quantity (Menge) – Zahl

Öffnen Sie den Taxonomiemanager und erstellen Sie eine Gruppe mit dem Namen „Halbstrukturierte Dokumente“, eine Kategorie mit dem Namen „Finanzen“ und einen Dokumenttyp namens „Belege“. Erstellen Sie die oben aufgeführten Felder mit benutzerfreundlichen Namen zusammen mit den jeweiligen Datentypen.



4. Das Dokument digitalisieren

Fügen Sie in der Datei Main.xaml eine Load Taxonomy-Aktivität hinzu und erstellen Sie eine Variable für die Taxonomieausgabe.

Fügen Sie eine Digitize Document-Aktivität mit UiPath Document OCR hinzu. Geben Sie die Eingabeeigenschaft Document Path an und erstellen Sie Ausgabevariablen für Dokumenttext und Dokumentobjektmodell an.

Denken Sie daran, den API-Schlüssel von Document Understanding in der Aktivität „UiPath Document OCR“ hinzuzufügen.

5. Die Daten mit dem ML-Modell für Belege (Receipts) extrahieren

Fügen Sie eine Data Extraction Scope-Aktivität hinzu und geben Sie die Eigenschaften ein.

Ziehen Sie eine Machine Learning Extractor Aktivität und legen Sie sie ab. Ein Popup mit drei Eingabeparametern, Endpoint, ML Skill und ApiKey, wird auf dem Bildschirm angezeigt.

Geben Sie den Parameter Endpoint mit dem öffentlichen Endpunkt für „Receipts“ (Belege) ein, nämlich https://du.uipath.com/ie/receipts. Geben Sie dann den API-Schlüssel von Document Understanding an.

Klicken Sie auf Funktionen abrufen.

Als Nächstes konfigurieren wir den Extraktor. Das Konfigurieren des Extraktors bedeutet, dass Sie die Felder, die Sie im Taxonomiemanager erstellt haben, den im ML-Modell verfügbaren Feldern zuzuordnen. Hierzu die folgende Abbildung:



Um den Machine Learning Extractor mit einer ML-Fähigkeit zu verwenden, wählen Sie die ML-Fähigkeit aus der Dropdownliste aus und konfigurieren Sie den Extraktor.

Ihr Roboter-Assistent muss mit demselben Mandanten wie Ihre ML-Fähigkeit verbunden sein.



6. Die Ergebnisse mithilfe der Validation Station validieren

Um die Ergebnisse über die Validation Station zu überprüfen, verschieben Sie die Aktivität Present Validation Station durch Ziehen und Ablegen und geben Sie die Eingabedetails an.



7. Die Extraktionsergebnisse exportieren

Um die Extraktionsergebnisse zu exportieren, ziehen Sie eine Aktivität des Typs Export Extraction Results an das Ende Ihres Workflows. Dadurch werden die Ergebnisse in ein DataSet ausgegeben, das mehrere Tabellen enthält, die dann in eine Excel-Datei geschrieben oder direkt in einem nachgelagerten Prozess verwendet werden können.


Beispiel herunterladen

Laden Sie dieses Beispielprojekt unter diesem Link herunter.

Das Beispiel enthält zwei Workflows:

  • Main.xaml – In diesem Workflow werden die Extraktionsergebnisse mithilfe der Validation Station validiert; dies wird im obigen Abschnitt beschrieben
  • Main – Unattended.xaml – In diesem Workflow werden die Extraktionsergebnisse mithilfe der Validation Action validiert; dies wird im folgenden Abschnitt beschrieben

Verwenden des ML-Modells „Receipts“ mit „Öffentlicher Endpunkt“ und Validation Action

Sehen wir uns nun an, wie Sie eine Action Center-Validierungsaktion verwenden, anstatt die Validation Station vorzulegen.

Wie funktionieren Aufgaben im Action Center?

Wenn eine Automatisierung Entscheidungen wie Genehmigungen, Eskalationen und Ausnahmen enthält, die ein Mensch treffen sollte, kann der Prozess dank UiPath Action Center einfach vom Roboter zum Menschen übergeben werden (und wieder zurück).

Document Understanding-Action Center-Aktivitäten sind im Paket UiPath.IntelligentOCR.Activities und UiPath.Persistance.Activities enthalten. Vergessen Sie nicht, Persistenz-Aktivitäten in den allgemeinen Einstellungen in UiPath Studio zu aktivieren:



Wie funktioniert die Validation Action?

Die Produktivität kann durch Hinzufügen eines Orchestrierungsprozesses erhöht werden, der Dokumentvalidierungsaktionen im Action Center sowohl im lokalen Orchestrator als auch der Automation Cloud hinzufügt. Diese Aktion reduziert Ihren Bedarf an der lokalen Speicherung der Dokumente, dem Installieren eines Roboters auf allen Maschinen mit menschlichen Benutzern oder dem Warten des Roboters, bis die Validierung durch menschliche Benutzer abgeschlossen ist.

Weitere Details finden Sie hier.

Wie wird die Validation Action verwendet?

Wiederholen Sie die Schritte 1 bis 5, die im obigen Abschnitt beschrieben sind.

Anstatt die Aktivität Present Validation Station zu verwenden, verwenden Sie die Aktivitäten Create Document Validation Action und Wait for Document Validation Action and Resume.

Die folgende Abbildung zeigt die Aktivität Create Document Validation Action und ihre Eigenschaften.



Dadurch wird eine Dokumentvalidierungsaktion im Action Center erstellt. Die Ausgabe der Aktivität „Create Document Validation Action“ kann dann mit der Aktivität Wait for Document Validation Action and Resume verwendet werden, um Orchestrierungsworkflows nach Abschluss menschlicher Aktionen im Action Center auszusetzen und fortzusetzen.

War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
UiPath Logo weiß
Vertrauen und Sicherheit
© 2005-2024 UiPath. All rights reserved.