Abonnieren

UiPath Document Understanding

UiPath Document Understanding

Extrahieren von Daten aus Belegen

🚧

Zielgruppe

Das Ziel dieser Seite ist es, neuen Benutzern zu helfen, sich mit Document Understanding vertraut zu machen.


Für skalierbare Produktionsbereitstellungen wird dringend empfohlen, den Document Understanding-Prozess zu verwenden, der in UiPath Studio im Abschnitt „Vorlagen“ zu finden ist.

This quickstart shows you how to extract data from receipts using the out-of-the-box Receipts ML model with its corresponding public endpoint.

Die Validierung kann entweder durch Präsentieren der Validation Station oder mithilfe der Validation Action im Action Center erfolgen. Beide Optionen werden in den folgenden Abschnitten beschrieben.

Verwenden des ML-Modells „Receipts“ mit „Öffentlicher Endpunkt“ und Validation Station

In diesem Abschnitt validieren wir die Extraktionsergebnisse mithilfe der Validation Station.

Um einen einfachen Workflow mit dem ML-Modell Receipts zu erstellen, führen Sie die folgenden Schritte aus.

  1. Einen leeren Prozess erstellen
  2. Die erforderlichen Aktivitätspakete installieren
  3. Taxonomie erstellen
  4. Das Dokument digitalisieren
  5. Die Daten mit dem ML-Modell für Belege (Receipts) extrahieren
  6. Die Ergebnisse mithilfe der Validation Station validieren
  7. Die Extraktionsergebnisse exportieren

Sehen wir uns nun jeden Schritt im Detail an.

1. Einen leeren Prozess erstellen


Starten Sie UiPath Studio.

Klicken Sie in der START-Backstage-Ansicht auf Prozess, um ein neues Projekt zu erstellen.

Das Fenster Neuer leerer Prozess wird angezeigt. Geben Sie in diesem Fenster einen Namen für das neue Projekt ein. Wenn Sie möchten, können Sie auch eine Beschreibung eingeben, um Ihre Projekte einfacher auffindbar zu machen.

Klicken Sie auf Erstellen. Das neue Projekt wird in Studio geöffnet.

2. Die erforderlichen Aktivitätspakete installieren


Installieren Sie über die Schaltfläche Pakete verwalten im Menüband neben den standardmäßig zum Projekt hinzugefügten Kern-Aktivitätenpaketen (UiPath.Excel.Activities, UiPath.Mail.Activities, UiPath.System.Activities, UiPath.UIAutomation.Activities) die folgenden Aktivitätspakete:

3. Taxonomie erstellen


Sobald die Aktivitätspakete installiert sind, listen Sie die erforderlichen Felder auf. Das ML-Modell Receipts unterstützt die Datenextraktion für die folgenden Felder:

  • name (Name) – Text
  • vendor-addr (Lieferantenadresse) – Adresse
  • total (gesamt) – Zahl
  • date (Datum) – Datum
  • phone (Telefonnummer) – Text
  • currency (Währung) – Text
  • expense-type (Ausgabentyp) – Text
  • items (Posten) – Tabelle
    • description (Beschreibung) – Text
    • line-amount (Zeilensumme) – Zahl
    • unit-price (Stückpreis) – Zahl
    • quantity (Menge) – Zahl

Open Taxonomy Manager and create a group named "Semi Structured Documents", a category named "Finance", and a document type named "Receipts". Create the above listed fields with user friendly names along with respective data types.

17121712

4. Das Dokument digitalisieren


In the Main.xaml file, add a Load Taxonomy activity and create a variable for the taxonomy output.

Add a Digitize Document activity with UiPath Document OCR. Provide the input property Document Path and create output variables for Document Text and Document Object Model.

Denken Sie daran, den API-Schlüssel von Document Understanding in der Aktivität „UiPath Document OCR“ hinzuzufügen.

5. Die Daten mit dem ML-Modell für Belege (Receipts) extrahieren


Add a Data Extraction Scope activity and fill in the properties.

Drag and drop a Machine Learning Extractor activity. A pop-up with three input parameters, Endpoint, ML Skill, and ApiKey, is displayed on the screen.

Fill in the Endpoint parameter with the Receipts Public Endpoint, namely https://du.uipath.com/ie/receipts, and provide the Document Understanding API key.

Klicken Sie auf Funktionen abrufen.

Als Nächstes konfigurieren wir den Extraktor. Das Konfigurieren des Extraktors bedeutet, dass Sie die Felder, die Sie im Taxonomiemanager erstellt haben, den im ML-Modell verfügbaren Feldern zuzuordnen. Hierzu die folgende Abbildung:

11191119

Um den Machine Learning Extractor mit einer ML-Fähigkeit zu verwenden, wählen Sie die ML-Fähigkeit aus der Dropdownliste aus und konfigurieren Sie den Extraktor.
You must have your robot assistant connected to the same tenant as your ML Skill.

296296

6. Die Ergebnisse mithilfe der Validation Station validieren


To check the results through Validation Station, drag and drop the Present Validation Station activity and provide the input details.

419419

7. Die Extraktionsergebnisse exportieren


To export the extraction results, drag and drop an Export Extraction Results activity to the end of your workflow. This outputs the results into a DataSet that contains multiple tables, which could then be written to an Excel file or be used directly in a downstream process.

419419

Beispiel herunterladen


Download this sample project using this link.

Das Beispiel enthält zwei Workflows:

  • Main.xaml – In diesem Workflow werden die Extraktionsergebnisse mithilfe der Validation Station validiert; dies wird im obigen Abschnitt beschrieben
  • Main – Unattended.xaml – In diesem Workflow werden die Extraktionsergebnisse mithilfe der Validation Action validiert; dies wird im folgenden Abschnitt beschrieben

Verwenden des ML-Modells „Receipts“ mit „Öffentlicher Endpunkt“ und Validation Action

Sehen wir uns nun an, wie Sie eine Action Center-Validierungsaktion verwenden, anstatt die Validation Station vorzulegen.

Wie funktionieren Aufgaben im Action Center?


Wenn eine Automatisierung Entscheidungen wie Genehmigungen, Eskalationen und Ausnahmen enthält, die ein Mensch treffen sollte, kann der Prozess dank UiPath Action Center einfach vom Roboter zum Menschen übergeben werden (und wieder zurück).

Document Understanding-Action Center-Aktivitäten sind im Paket UiPath.IntelligentOCR.Activities und UiPath.Persistance.Activities enthalten. Vergessen Sie nicht, Persistenz-Aktivitäten in den allgemeinen Einstellungen in UiPath Studio zu aktivieren:

875875

Wie funktioniert die Validation Action?


Die Produktivität kann durch Hinzufügen eines Orchestrierungsprozesses erhöht werden, der Dokumentvalidierungsaktionen im Action Center sowohl im lokalen Orchestrator als auch der Automation Cloud hinzufügt. Diese Aktion reduziert Ihren Bedarf an der lokalen Speicherung der Dokumente, dem Installieren eines Roboters auf allen Maschinen mit menschlichen Benutzern oder dem Warten des Roboters, bis die Validierung durch menschliche Benutzer abgeschlossen ist.
More details here.

Wie wird die Validation Action verwendet?


Wiederholen Sie die Schritte 1 bis 5, die im obigen Abschnitt beschrieben sind.

Then, instead of using the Present Validation Station activity, use the Create Document Validation Action and Wait for Document Validation Action and Resume activities.

Die folgende Abbildung zeigt die Aktivität Create Document Validation Action und ihre Eigenschaften.

601601

This creates a document validation action in Action Center. The output of the Create Document Validation Action activity can then be used with the Wait for Document Validation Action and Resume activity to suspend and resume orchestration workflows upon human action completion in Action Center.

Aktualisiert vor 4 Monaten


Extrahieren von Daten aus Belegen


Auf API-Referenzseiten sind Änderungsvorschläge beschränkt

Sie können nur Änderungen an dem Textkörperinhalt von Markdown, aber nicht an der API-Spezifikation vorschlagen.