Abonnieren

UiPath Document Understanding

UiPath Document Understanding

Extrahieren von Daten aus Formularen

🚧

Zielgruppe

Das Ziel dieser Seite ist es, neuen Benutzern zu helfen, sich mit Document Understanding vertraut zu machen.


Für skalierbare Produktionsbereitstellungen wird dringend empfohlen, den Document Understanding-Prozess zu verwenden, der in UiPath Studio im Abschnitt „Vorlagen“ zu finden ist.

This quickstart guides you through the steps required to extract information from W-9 forms using the Intelligent Form Extractor. The W-9 forms are used as an example, but the procedure is similar for other types of documents where the data is structured.

Dies sind die Schritte, die für einen Beginn von Grund auf befolgt werden müssen:

  1. Einen leeren Prozess erstellen
  2. Die erforderlichen Aktivitätspakete installieren
  3. Taxonomie erstellen
  4. Das Dokument digitalisieren
  5. Extrahieren der Daten mit dem Intelligent Form Extractor
  6. Die Ergebnisse mithilfe der Validation Station validieren
  7. Export Extraction Results

Sehen wir uns nun jeden Schritt im Detail an.

1. Einen leeren Prozess erstellen


Starten Sie UiPath Studio.

Klicken Sie in der START-Backstage-Ansicht auf Prozess, um ein neues Projekt zu erstellen.

Das Fenster Neuer leerer Prozess wird angezeigt. Geben Sie in diesem Fenster einen Namen für das neue Projekt ein. Wenn Sie möchten, können Sie auch eine Beschreibung eingeben, um Ihre Projekte einfacher auffindbar zu machen.

Klicken Sie auf Erstellen. Das neue Projekt wird in Studio geöffnet.

2. Die erforderlichen Aktivitätspakete installieren


Installieren Sie über die Schaltfläche Pakete verwalten im Menüband neben den standardmäßig zum Projekt hinzugefügten Kern-Aktivitätenpaketen (UiPath.Excel.Activities, UiPath.Mail.Activities, UiPath.System.Activities, UiPath.UIAutomation.Activities) die folgenden Aktivitätspakete:

3. Taxonomie erstellen


Sobald Pakete installiert sind, listen Sie die erforderlichen Felder auf. Wir extrahieren Daten für die folgenden Felder:

  • 1_Name – Text
  • 2_BusinessName – Text
  • 3a_Individual – Boolean
  • 3b_CCorp – Boolean
  • 3c_SCorp – Boolean
  • 3d_Partnership – Boolean
  • 3e_TrustEstate – Boolean
  • 3f_LLC – Boolean
  • 3f_LLCTaxClassification – Boolean
  • 3g_Other – Boolean
  • 3g_OtherDetail – Boolean
  • 5_Address – Text
  • 6_CityStateZip – Text
  • 7_AcctNumber – Text
  • TIN_SSN – Text
  • TIN_ETN – Text
  • Certification_Signature – Boolean
  • Certification_SignatureDate – Date

Open Taxonomy Manager and create a group named "Structured Documents", a category named "Lending Forms", and a document type named "W-9". Create above listed fields with user friendly names along with respective data types.

22882288

4. Das Dokument digitalisieren


In the Main.xaml file, add a Load Taxonomy activity and create a variable for the taxonomy output.

Add a Digitize Document activity with UiPath Document OCR. Provide the input property Document Path and create output variables for Document Text and Document Object Model.

Denken Sie daran, den API-Schlüssel von Document Understanding in der Aktivität „UiPath Document OCR“ hinzuzufügen.

5. Extrahieren der Daten mit dem Intelligent Form Extractor


Add a Data Extraction Scope activity and fill in the properties.

Drag and drop the Intelligent Form Extractor within it. The endpoint should be auto-populated with the Intelligent Form Extractor endpoint, namely https://du.uipath.com/svc/intelligentforms. Provide the Document Understanding API key.

Um eine neue Vorlage zu erstellen, klicken Sie auf Vorlagen verwalten > Vorlage erstellen. Ein Popup-Fenster wird geöffnet.

Wählen Sie unter Dokumenttyp den zuvor erstellten Dokumenttyp „W-9“ aus.

Geben Sie unter Dokumentname einen Namen für Ihre Vorlage ein.

Fügen Sie unter Vorlagendokument (wenn möglich native PDF) ein Vorlagendokument an, in dem Sie die Feldpositionen zuordnen möchten.

Under OCR Engine, select again the UiPath Document OCR. Just like before, the endpoint should be auto-populated, namely https://du.uipath.com/ocr, and you just need to provide the API Key.

Klicken Sie auf Konfigurieren, um zum nächsten Schritt zu wechseln. Das Popup-Fenster Vorlagenmanager wird geöffnet.

Here, we will need to select the areas where we want Intelligent Form Extractor to search for our fields. Configure them by following the steps detailed here. You also have the option of using anchors for your fields. More information on anchors here.

Am Ende sollte es ungefähr so aussehen:

19201920

Klicken Sie auf Speichern. Auf dieser Anzeige können Sie ggf. die handschriftlichen Felder zw. Unterschriftsfelder definieren. Sie können auch Synonyme für boolesche Felder definieren. Schließen Sie das Fenster, sobald Sie fertig sind.

783783

Als Nächstes konfigurieren wir den Extraktor, sodass der Intelligent Form Extractor alle Dokumente vom Typ W-9 verarbeitet.

844844

6. Die Ergebnisse mithilfe der Validation Station validieren


To check the results through Validation Station, drag and drop the Present Validation Station activity and provide the input details.

421421

7. Die Extraktionsergebnisse exportieren


To export the extraction results, validated or not, drag and drop an Export Extraction Results activity to the end of your workflow. This outputs the results into a DataSet that contains multiple tables, which could then be written to an Excel file or be used directly in a downstream process.

423423

Beispiel herunterladen


Download this sample project to execute the W-9 with Intelligent Form Extractor workflow using this link.

Aktualisiert vor 9 Monaten


Extrahieren von Daten aus Formularen


Auf API-Referenzseiten sind Änderungsvorschläge beschränkt

Sie können nur Änderungen an dem Textkörperinhalt von Markdown, aber nicht an der API-Spezifikation vorschlagen.