UiPath Documentation
document-understanding
2023.10
false
Wichtig :
Es kann 1–2 Wochen dauern, bis die Lokalisierung neu veröffentlichter Inhalte verfügbar ist.
UiPath logo, featuring letters U and I in white

Document Understanding user guide

Letzte Aktualisierung 6. Apr. 2026

Extrahieren von Daten aus Formularen

Wichtig:

The aim of this page is to help first time users get familiar with Document UnderstandingTM.

For scalable production deployments, we strongly recommend using the Document Understanding Process available in UiPath® Studio under the Templates section.

This quickstart guides you through the steps required to extract information from W-9 forms using the Intelligent Form Extractor. The W-9 forms are used as an example, but the procedure is similar for other types of documents where the data is structured.

Dies sind die Schritte, die für einen Beginn von Grund auf befolgt werden müssen:

  1. Einen leeren Prozess erstellen
  2. Die erforderlichen Aktivitätspakete installieren
  3. Taxonomie erstellen
  4. Das Dokument digitalisieren
  5. Extrahieren der Daten mit dem Intelligent Form Extractor
  6. Die Ergebnisse mithilfe der Validation Station validieren
  7. Extraktionsergebnisse exportieren

1. Einen leeren Prozess erstellen

Starten Sie UiPath Studio.

In the HOME backstage view, select Process to create a new project.

Das Fenster Neuer leerer Prozess wird angezeigt. Geben Sie in diesem Fenster einen Namen für das neue Projekt ein. Wenn Sie möchten, können Sie auch eine Beschreibung eingeben, um Ihre Projekte einfacher auffindbar zu machen.

Select Create. The new project is opened in Studio.

2. Die erforderlichen Aktivitätspakete installieren

From the Manage Packages button in the ribbon, besides the core activities packages (UiPath.Excel.Activities,UiPath.Mail.Activities,UiPath.System.Activities,UiPath.UIAutomation.Activities) that are added to the project by default, install the following activities packages:

3. Taxonomie erstellen

Sobald die Pakete installiert sind, werden die erforderlichen Felder aufgeführt. Wir extrahieren Daten für folgende Felder:

  • 1_Name – Text
  • 2_BusinessName – Text
  • 3a_Individual – Boolean
  • 3b_CCorp – Boolean
  • 3c_SCorp – Boolean
  • 3d_Partnership – Boolean
  • 3e_TrustEstate – Boolean
  • 3f_LLC – Boolean
  • 3f_LLCTaxClassification – Boolean
  • 3g_Other – Boolean
  • 3g_OtherDetail – Boolean
  • 5_Address – Text
  • 6_CityStateZip – Text
  • 7_AcctNumber – Text
  • TIN_SSN – Text
  • TIN_ETN – Text
  • Certification_Signature – Boolean
  • Certification_SignatureDate – Date

Open Taxonomy Manager and create a group named Structured Documents, a category named Lending Forms, and a document type named W-9. Createlisted fields with user friendly names along with respective data types.

Screenshot zur Beschreibung des Taxonomiemanagers.

4. Das Dokument digitalisieren

In the Main.xaml file, add a Load Taxonomy activity and create a variable for the taxonomy output.

Add a Digitize Document activity with UiPath Document OCR. Provide the input property Document Path and create output variables for Document Text and Document Object Model.

Denken Sie daran, den API-Schlüssel von Document Understanding in der Aktivität „UiPath Document OCR“ hinzuzufügen.

5. Extrahieren der Daten mit dem Intelligent Form Extractor

Add a Data Extraction Scope activity and fill in the properties.

Drag and drop the Intelligent Form Extractor within it. The endpoint should be auto-populated with the Intelligent Form Extractor endpoint, namely https://du.uipath.com/svc/intelligentforms. Provide the Document Understanding API key.

Once that is done, to create a new template, select Manage Templates > Create Template. A pop-up window opens.

Wählen Sie unter Dokumenttyp den zuvor erstellten Dokumenttyp „W-9“ aus.

Geben Sie unter Dokumentname einen Namen für Ihre Vorlage ein.

Under Template document (native PDF if possible), attach a template document where you are going to map the field positions.

Under OCR Engine, select again the UiPath Document OCR. Just like before, the endpoint should be auto-populated, namely https://du.uipath.com/ocr, and you just need to provide the API Key.

Select Configure to move to the next step. The Template Manager pop-up window opens.

Here, we will need to select the areas where we want Intelligent Form Extractor to search for our fields. Configure them by following the steps detailed here. You also have the option of using anchors for your fields. More information on anchors here.

Am Ende sollte es ungefähr so aussehen:

Screenshot zur Beschreibung eines W9-Formulars im Vorlagenmanager.

Select Save. In this screen, you can define the handwritten or signature fields, where applicable. You can also define synonyms for Boolean fields. Close the window after you are done.

Screenshot zur Beschreibung des Vorlagenmanagers.

Als Nächstes konfigurieren wir den Extraktor, sodass der Intelligent Form Extractor alle Dokumente vom Typ W-9 verarbeitet.

Screenshot zur Beschreibung von „Extraktoren konfigurieren“.

6. Die Ergebnisse mithilfe der Validation Station validieren

To check the results through Validation Station, drag and drop the Present Validation Station activity and provide the input details.

Screenshot zur Beschreibung der Aktivität „Present Validation Station“.

7. Die Extraktionsergebnisse exportieren

To export the extraction results, validated or not, drag and drop an Export Extraction Results activity to the end of your workflow. This outputs the results into a DataSet that contains multiple tables, which could then be written to an Excel file or be used directly in a downstream process.

Screenshot zur Beschreibung der Aktivität „Export Extraction Results“.

Beispiel herunterladen

Download this sample project to execute the W-9 with Intelligent Form Extractor workflow using this link.

War diese Seite hilfreich?

Verbinden

Benötigen Sie Hilfe? Support

Möchten Sie lernen? UiPath Academy

Haben Sie Fragen? UiPath-Forum

Auf dem neuesten Stand bleiben