Abonnieren

UiPath Document Understanding

UiPath Document Understanding

Data Manager

Auf dieser Seite wird beschrieben, wie der Data Manager zum Beschriften ein neues Dataset und zum erneuten Trainieren eines ML-Modells verwendet wird.

Aufrufen und Konfigurieren des Data Managers


Launch the created data labeling session in First Run Experience and go to the settings to configure the OCR.

Choose the OCR you intend to use in the OCR method dropdown menu. For UiPathDocumentOCR, paste the Document Understanding license key (retrieve the Document Understanding API key from the Admin > License page) and then paste the OCR URL you generated when you deployed UiPathDocumentOCR.

14991499

Configure the prelabelling with the models that you have deployed following the instructions here. Paste the model public ML Skill endpoint and the Document Understanding license key, and then click Save.

14881488

For more details, please check the documentation here: Configure Data Manager.

Importieren von Dokumenten


Click the Import button importimport from a Data Manager Session.

16741674

Benennen Sie das Dataset und klicken Sie auf Dateien zum Hochladen durchsuchen.

15151515

Wählen Sie das Dokument aus, das Sie hochladen möchten.

12781278

Klicken Sie auf Ja.

12801280

For more details, please check the documentation here: Import Documents.

Erstellen von Extraktionsfeldern


Click create_fieldcreate_field to create fields to be extracted.

Sie können bis zu 40 Felder erstellen.

Für diese Validierungsübung können Sie einige gängige Rechnungsfelder wie date (Datum), name, invoice-no (Rechnungsnummer) und total (Summe) erstellen. Stellen Sie sicher, dass Sie den Inhaltstyp entsprechend ändern – date (Datum), name (Zeichenfolge), invoice-no (Zeichenfolge) und total (Zahl).

15031503

For more details, please check the documentation here: Create & Configure Fields.

Beschriften von Dokumenten


Jetzt können Sie mit der Beschriftung der Dokumente beginnen.

Click the predict button predictpredict on top to use the base invoice model to predict the labels for the defined fields, and correct it if the prediction is wrong.

Um die Beschriftung zu ändern, ziehen Sie den Mauszeiger über das Feld und drücken Sie die Kurzwahltaste, um sie zu beschriften (z. B. d für das Beschriftungsdatum im folgenden Beispiel).

Verwenden Sie den Pfeil oben, um zum nächsten Dokument zu wechseln, bis Sie die Validierung der Beschriftungen für alle hochgeladenen Rechnungen abgeschlossen haben.

📘

Hinweis:

Da das Basismodell Invoices bereits sehr gut funktioniert hat und die Beispielrechnung relativ einfach ist und keine übermäßigen Unregelmäßigkeiten hat, liegt die Vorhersagegenauigkeit in diesem Fall bei nahezu 100 %. So müssen Sie möglicherweise gar keine Beschriftungen korrigieren.

18701870

For more details about labeling documents, please check the documentation here: Label Documents.

Exportieren von Dokumenten


Make sure to select the correct dataset in the dataset filtering and click the Export button exportexport.

16501650

Klicken Sie auf Exportieren.

14031403

Wechseln Sie unter demselben AI Center-Projekt zu Datasets. Dort sollten Sie das exportierte Trainings-Dataset sehen können.

16531653

For more details, please check the documentation: Export Documents.

Trainieren eines benutzerdefinierten Modells im AI Center

Wechseln Sie zu Pipelines > Neue erstellen. Wählen Sie den Typ der Auswertungsausführung sowie das Modellpaket und den Eingabedatensatz aus.

16531653

Wählen Sie den Unterordner unter „Export“ als Eingabe-Dataset aus.

14311431

Klicken Sie auf Erstellen, um die Pipeline zu starten. Die Ausführung der Pipeline auf CPU-Maschinen kann 1–2 Stunden dauern.

Bereitstellen des neu trainierten ML-Modells als ML-Fähigkeit


Rufen Sie ML-Fähigkeiten auf und erstellen Sie eine neue ML-Fähigkeit.

Wählen Sie dasselbe Rechnungsmodellpaket aus, das zuvor erstellt wurde. Da wir das Modell neu trainiert haben, gibt es jetzt eine neue Nebenpaketversion (1 statt 0). Wählen Sie hierbei die neueste aus.

13951395

Sobald die ML-Fähigkeit erstellt wurde, wechseln Sie zu Aktuelle Bereitstellung ändern, um die ML-Fähigkeit öffentlich zu machen. Schalten Sie den Umschalter um und klicken Sie auf Bestätigen.

12171217

Kopieren Sie die URL der öffentlichen ML-Fähigkeit zur späteren Verwendung.

12781278

Herzlichen Glückwunsch! Sie haben nun ein Invoice-Modell mit Ihrem eigenen Datensatz neu trainiert und den Endpunkt erstellt, um auf das Modell zuzugreifen.

Aktualisiert vor 12 Monaten


Data Manager


Auf API-Referenzseiten sind Änderungsvorschläge beschränkt

Sie können nur Änderungen an dem Textkörperinhalt von Markdown, aber nicht an der API-Spezifikation vorschlagen.