- Überblick
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Extrahieren von Daten aus Belegen
- Mit einem zusätzlichen Feld erneut trainierte Rechnungen
- Extrahieren von Daten aus Formularen
- Framework-Komponenten
- Überblick
- Document Understanding-Aktivitäten
- Übersicht zur Dokumentklassifizierung
- „Klassifizierer konfigurieren“-Assistent von Classify Document Scope
- Intelligenter Schlüsselwortklassifizierer
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Machine Learning Classifier
- Generativer Klassifizierer
- Dokumentklassifizierung – verwandte Aktivitäten
- Datenverbrauch
- API-Aufrufe
- ML-Pakete
- Überblick
- Document Understanding – ML-Paket
- DocumentClassifier – ML-Paket
- ML-Pakete mit OCR-Funktionen
- 1040 – ML-Paket
- 1040 Anlage C – ML-Paket
- 1040 Anlage D – ML-Paket
- 1040 Anlage E – ML-Paket
- 1040x – ML-Paket
- 3949a – ML-Paket
- 4506T – ML-Paket
- 709 – ML-Paket
- 941x – ML-Paket
- 9465 – ML-Paket
- 990 – ML-Paket – Vorschau
- ACORD125 – ML-Paket
- ACORD126 – ML-Paket
- ACORD131 – ML-Paket
- ACORD140 – ML-Paket
- ACORD25 – ML-Paket
- Bank Statements – ML-Paket
- BillsOfLading – ML-Paket
- Certificate of Incorporation – ML-Paket
- Certificates of Origin – ML-Paket
- Checks – ML-Paket
- Children Product Certificate – ML-Paket
- CMS1500 – ML-Paket
- EU Declaration of Conformity – ML-Paket
- Financial Statements – ML-Paket
- FM1003 – ML-Paket
- I9 – ML-Paket
- ID Cards – ML-Paket
- Invoices – ML-Paket
- InvoicesChina – ML-Paket
- Rechnungen Hebräisch – ML-Paket
- InvoicesIndia – ML-Paket
- InvoicesJapan – ML-Paket
- Invoices Shipping – ML-Paket
- Packing Lists – ML-Paket
- Passports – ML-Paket
- Gehaltsabrechnungen (Pay slips) – ML-Paket
- Purchase Orders – ML-Paket
- Zahlungsbelege – ML-Paket
- RemittanceAdvices – ML-Paket
- UB04 – ML-Paket
- Utility Bills – ML-Paket
- Vehicle Titles – ML-Paket
- W2 – ML-Paket
- W9 – ML-Paket
- Andere out-of-the-box ML-Pakete
- Öffentliche Endpunkte
- Hardwareanforderungen
- Pipelines
- Dokumentmanager
- OCR-Dienste
- Unterstützte Sprachen
- Deep Learning
- Insights-Dashboards
- Document Understanding – in der Automation Suite bereitgestellt
- Document Understanding – im eigenständigen AI Center bereitgestellt
- Lizenzierung
- Aktivitäten
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)

Document Understanding-Benutzerhandbuch.
Extrahieren von Daten aus Formularen
The aim of this page is to help first time users get familiar with Document UnderstandingTM.
For scalable production deployments, we strongly recommend using the Document Understanding Process available in UiPath® Studio under the Templates section.
This quickstart guides you through the steps required to extract information from W-9 forms using the Intelligent Form Extractor. The W-9 forms are used as an example, but the procedure is similar for other types of documents where the data is structured.
Dies sind die Schritte, die für einen Beginn von Grund auf befolgt werden müssen:
- Einen leeren Prozess erstellen
- Die erforderlichen Aktivitätspakete installieren
- Taxonomie erstellen
- Das Dokument digitalisieren
- Extrahieren der Daten mit dem Intelligent Form Extractor
- Die Ergebnisse mithilfe der Validation Station validieren
- Extraktionsergebnisse exportieren
1. Einen leeren Prozess erstellen
Starten Sie UiPath Studio.
Wählen Sie in der Backstage-Ansicht HOME die Option Prozess, um ein neues Projekt zu erstellen.
Das Fenster Neuer leerer Prozess wird angezeigt. Geben Sie in diesem Fenster einen Namen für das neue Projekt ein. Wenn Sie möchten, können Sie auch eine Beschreibung eingeben, um Ihre Projekte einfacher auffindbar zu machen.
Wählen Sie Erstellen. Das neue Projekt wird in Studio geöffnet.
2. Die erforderlichen Aktivitätspakete installieren
Installieren Sie über die Schaltfläche Pakete verwalten im Menüband neben den standardmäßig zum Projekt hinzugefügten Kern-Aktivitätenpaketen (UiPath.Excel.Activities, UiPath.Mail.Activities, UiPath.System.Activities, UiPath.UIAutomation.Activities) die folgenden Aktivitätspakete:
3. Taxonomie erstellen
Sobald die Pakete installiert sind, werden die erforderlichen Felder aufgeführt. Wir extrahieren Daten für folgende Felder:
- 1_Name –
Text - 2_BusinessName –
Text - 3a_Individual –
Boolean - 3b_CCorp –
Boolean - 3c_SCorp –
Boolean - 3d_Partnership –
Boolean - 3e_TrustEstate –
Boolean - 3f_LLC –
Boolean - 3f_LLCTaxClassification –
Boolean - 3g_Other –
Boolean - 3g_OtherDetail –
Boolean - 5_Address –
Text - 6_CityStateZip –
Text - 7_AcctNumber –
Text - TIN_SSN –
Text - TIN_ETN –
Text - Certification_Signature –
Boolean - Certification_SignatureDate –
Date
Open Taxonomy Manager and create a group named Structured Documents, a category named Lending Forms, and a document type named W-9. Createlisted fields with user friendly names along with respective data types.

4. Das Dokument digitalisieren
In the Main.xaml file, add a Load Taxonomy activity and create a variable for the taxonomy output.
Add a Digitize Document activity with UiPath Document OCR. Provide the input property Document Path and create output variables for Document Text and Document Object Model.
Denken Sie daran, den API-Schlüssel von Document Understanding in der Aktivität „UiPath Document OCR“ hinzuzufügen.
5. Extrahieren der Daten mit dem Intelligent Form Extractor
Fügen Sie eine Data Extraction Scope-Aktivität hinzu und geben Sie die Eigenschaften ein.
Drag and drop the Intelligent Form Extractor within it. The endpoint should be auto-populated with the Intelligent Form Extractor endpoint, namely https://du.uipath.com/svc/intelligentforms. Provide the Document Understanding API key.
Wenn diese abgeschlossen ist, wählen Sie Vorlagen verwalten > Vorlage erstellen, um eine neue Vorlage zu erstellen. Ein Popup-Fenster wird geöffnet.
Wählen Sie unter Dokumenttyp den zuvor erstellten Dokumenttyp „W-9“ aus.
Geben Sie unter Dokumentname einen Namen für Ihre Vorlage ein.
Fügen Sie unter Vorlagendokument (wenn möglich native PDF) ein Vorlagendokument an, in dem Sie die Feldpositionen zuordnen möchten.
Under OCR Engine, select again the UiPath Document OCR. Just like before, the endpoint should be auto-populated, namely https://du.uipath.com/ocr, and you just need to provide the API Key.
Wählen Sie Konfigurieren, um zum nächsten Schritt zu gehen. Das Popup-Fenster Vorlagenmanager wird geöffnet.
Hier wählen wir die Bereiche aus, in denen der Intelligent Form Extractor nach unseren Feldern suchen soll. Konfigurieren Sie sie, indem Sie die hier beschriebenen Schritte ausführen. Sie haben auch die Möglichkeit, Anker für Ihre Felder zu verwenden. Weitere Informationen zu Ankern finden Sie hier.
Am Ende sollte es ungefähr so aussehen:

Wählen Sie Speichern. Auf dieser Anzeige können Sie ggf. die handschriftlichen Felder zw. Unterschriftsfelder definieren. Sie können auch Synonyme für boolesche Felder definieren. Schließen Sie das Fenster, sobald Sie fertig sind.

Als Nächstes konfigurieren wir den Extraktor, sodass der Intelligent Form Extractor alle Dokumente vom Typ W-9 verarbeitet.

6. Die Ergebnisse mithilfe der Validation Station validieren
To check the results through Validation Station, drag and drop the Present Validation Station activity and provide the input details.

7. Die Extraktionsergebnisse exportieren
To export the extraction results, validated or not, drag and drop an Export Extraction Results activity to the end of your workflow. This outputs the results into a DataSet that contains multiple tables, which could then be written to an Excel file or be used directly in a downstream process.

Beispiel herunterladen
Download this sample project to execute the W-9 with Intelligent Form Extractor workflow using this link.
- 1. Einen leeren Prozess erstellen
- 2. Die erforderlichen Aktivitätspakete installieren
- 3. Taxonomie erstellen
- 4. Das Dokument digitalisieren
- 5. Extrahieren der Daten mit dem Intelligent Form Extractor
- 6. Die Ergebnisse mithilfe der Validation Station validieren
- 7. Die Extraktionsergebnisse exportieren
- Beispiel herunterladen