document-understanding
2022.4
true
Document Understanding-Benutzerhandbuch.
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 24. Okt. 2024

Extrahieren von Daten aus Formularen

Wichtig:

Das Ziel dieser Seite ist es, neuen Benutzern zu helfen, sich mit Document Understanding vertraut zu machen.

Für skalierbare Produktionsbereitstellungen wird dringend empfohlen, den Document Understanding-Prozess zu verwenden, der in UiPath Studio im Abschnitt „Vorlagen“ zu finden ist.

Diese Schnellstart-Anleitung führt Sie mithilfe des Intelligent Form Extractor durch die Schritte, die zum Extrahieren von Informationen aus W-9-Formularen erforderlich sind. Die W-9-Formulare werden als Beispiel verwendet, aber das Verfahren ist bei anderen Dokumenttypen ähnlich, auf denen die Daten strukturiert sind.

Dies sind die Schritte, die für einen Beginn von Grund auf befolgt werden müssen:

  1. Einen leeren Prozess erstellen
  2. Die erforderlichen Aktivitätspakete installieren
  3. Taxonomie erstellen
  4. Das Dokument digitalisieren
  5. Extrahieren der Daten mit dem Intelligent Form Extractor
  6. Die Ergebnisse mithilfe der Validation Station validieren
  7. Extraktionsergebnisse exportieren

Sehen wir uns nun jeden Schritt im Detail an.

1. Einen leeren Prozess erstellen

Starten Sie UiPath Studio.

Klicken Sie in der START-Backstage-Ansicht auf Prozess, um ein neues Projekt zu erstellen.

Das Fenster Neuer leerer Prozess wird angezeigt. Geben Sie in diesem Fenster einen Namen für das neue Projekt ein. Wenn Sie möchten, können Sie auch eine Beschreibung eingeben, um Ihre Projekte einfacher auffindbar zu machen.

Klicken Sie auf Erstellen. Das neue Projekt wird in Studio geöffnet.

2. Die erforderlichen Aktivitätspakete installieren

Installieren Sie über die Schaltfläche Pakete verwalten im Menüband neben den standardmäßig zum Projekt hinzugefügten Kern-Aktivitätenpaketen (UiPath.Excel.Activities, UiPath.Mail.Activities, UiPath.System.Activities, UiPath.UIAutomation.Activities) die folgenden Aktivitätspakete:

3. Taxonomie erstellen

Sobald Pakete installiert sind, listen Sie die erforderlichen Felder auf. Wir extrahieren Daten für die folgenden Felder:

  • 1_Name – Text
  • 2_BusinessName – Text
  • 3a_Individual – Boolean
  • 3b_CCorp – Boolean
  • 3c_SCorp – Boolean
  • 3d_Partnership – Boolean
  • 3e_TrustEstate – Boolean
  • 3f_LLC – Boolean
  • 3f_LLCTaxClassification – Boolean
  • 3g_Other – Boolean
  • 3g_OtherDetail – Boolean
  • 5_Address – Text
  • 6_CityStateZip – Text
  • 7_AcctNumber – Text
  • TIN_SSN – Text
  • TIN_ETN – Text
  • Certification_Signature – Boolean
  • Certification_SignatureDate – Date

Öffnen Sie den Taxonomiemanager und erstellen Sie eine Gruppe mit dem Namen „Strukturierte Dokumente“, eine Kategorie mit dem Namen „Leihscheine“ und einen Dokumenttyp namens „W-9“. Erstellen Sie oben aufgeführte Felder mit benutzerfreundlichen Namen zusammen mit den jeweiligen Datentypen.



4. Das Dokument digitalisieren

Fügen Sie in der Datei Main.xaml eine Load Taxonomy-Aktivität hinzu und erstellen Sie eine Variable für die Taxonomieausgabe.

Fügen Sie eine Digitize Document-Aktivität mit UiPath Document OCR hinzu. Geben Sie die Eingabeeigenschaft Document Path an und erstellen Sie Ausgabevariablen für Dokumenttext und Dokumentobjektmodell an.

Denken Sie daran, den API-Schlüssel von Document Understanding in der Aktivität „UiPath Document OCR“ hinzuzufügen.

5. Extrahieren der Daten mit dem Intelligent Form Extractor

Fügen Sie eine Data Extraction Scope-Aktivität hinzu und geben Sie die Eigenschaften ein.

Ziehen Sie den Intelligent Form Extractor hinein und legen Sie ihn ab. Der Endpunkt muss automatisch mit dem Intelligent Form Extractor-Endpunkt ausgefüllt werden, nämlich https://du.uipath.com/svc/intelligentforms. Geben Sie den API-Schlüssel von Document Understanding an.

Um eine neue Vorlage zu erstellen, klicken Sie auf Vorlagen verwalten > Vorlage erstellen. Ein Popup-Fenster wird geöffnet.

Wählen Sie unter Dokumenttyp den zuvor erstellten Dokumenttyp „W-9“ aus.

Geben Sie unter Dokumentname einen Namen für Ihre Vorlage ein.

Fügen Sie unter Vorlagendokument (wenn möglich native PDF) ein Vorlagendokument an, in dem Sie die Feldpositionen zuordnen möchten.

Wählen Sie unter OCR-Modul erneut die UiPath Document OCR aus. Wie zuvor sollte der Endpunkt automatisch ausgefüllt werden, nämlich „https://du.uipath.com/ocr“. Sie müssen nur den API-Schlüssel angeben.

Klicken Sie auf Konfigurieren, um zum nächsten Schritt zu wechseln. Das Popup-Fenster Vorlagenmanager wird geöffnet.

Hier wählen wir die Bereiche aus, in denen der Intelligent Form Extractor nach unseren Feldern suchen soll. Konfigurieren Sie sie, indem Sie die hier beschriebenen Schritte ausführen. Sie haben auch die Möglichkeit, Anker für Ihre Felder zu verwenden. Weitere Informationen zu Ankern finden Sie hier.

Am Ende sollte es ungefähr so aussehen:



Klicken Sie auf Speichern. Auf dieser Anzeige können Sie ggf. die handschriftlichen Felder zw. Unterschriftsfelder definieren. Sie können auch Synonyme für boolesche Felder definieren. Schließen Sie das Fenster, sobald Sie fertig sind.



Als Nächstes konfigurieren wir den Extraktor, sodass der Intelligent Form Extractor alle Dokumente vom Typ W-9 verarbeitet.



6. Die Ergebnisse mithilfe der Validation Station validieren

Um die Ergebnisse über die Validation Station zu überprüfen, verschieben Sie die Aktivität Present Validation Station durch Ziehen und Ablegen und geben Sie die Eingabedetails an.



7. Die Extraktionsergebnisse exportieren

Um die Extraktionsergebnisse zu exportieren (ob validiert oder nicht), ziehen Sie eine Aktivität Export Extraction Results an das Ende Ihres Workflows. Dadurch werden die Ergebnisse in ein DataSet ausgegeben, das mehrere Tabellen enthält, die dann in eine Excel-Datei geschrieben oder direkt in einem nachgelagerten Prozess verwendet werden können.


Beispiel herunterladen

Laden Sie das Beispielprojekt unter diesem Link herunter, um das W-9 mit dem Intelligent Form Extractor-Workflow auszuführen.

War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
Uipath Logo White
Vertrauen und Sicherheit
© 2005–2024 UiPath. Alle Rechte vorbehalten