document-understanding

2024.10

false

Wichtig :

Es kann 1–2 Wochen dauern, bis die Lokalisierung neu veröffentlichter Inhalte verfügbar ist.

Document Understanding-Benutzerhandbuch.

BEREITSTELLUNG:

Letzte Aktualisierung 19. Dez. 2025

Verwenden von Document Manager

Auf dieser Seite wird beschrieben, wie der Document Manager zum Beschriften eines neuen Datasets und zum erneuten Trainieren eines ML-Modells verwendet wird.

Access and configure Document Manager

Starten Sie die erstellte Datenbeschriftungssitzung unter First Run Experience und wechseln Sie zu den Einstellungen, um die OCR zu konfigurieren.

Wählen Sie die OCR, die Sie verwenden möchten, im Dropdownmenü OCR-Methode aus. Fügen Sie für UiPathDocumentOCR den Document Understanding^TM Lizenzschlüssel ein (rufen Sie den Document Understanding-API-Schlüssel über die Seite Admin > Lizenz ab) und fügen Sie dann die OCR-URL ein, die Sie bei der Bereitstellung von UiPathDocumentOCR generiert haben. Sehen Sie sich Deploy UiPathDocumentOCR an.

Konfigurieren Sie die Vorbeschriftung mit den Modellen, die Sie gemäß den Anweisungen unter Bereitstellen eines vorgefertigten ML-Pakets bereitgestellt haben. Fügen Sie den öffentlichen ML-Fähigkeits-Endpunkt des Modells und den Document Understanding-Lizenzschlüssel ein und wählen Sie dann Speichern aus.

Weitere Informationen finden Sie in der Dokumentation hier: Verwenden eines vordefinierten Schemas.

Importieren von Dokumenten

Klicken Sie in einer Document Manager-Sitzung auf die Schaltfläche Importieren .
Benennen Sie das Dataset und wählen Sie Dateien zum Hochladen durchsuchen aus.
Wählen Sie das Dokument aus, das Sie hochladen möchten.
Wählen Sie Ja aus.

Erstellen von Extraktionsfeldern

Wählen Sie Plus-Symbol , um zu extrahierende Felder zu erstellen.

Sie können bis zu 40 Felder erstellen.

Für diese Validierungsübung können Sie einige gängige Rechnungsfelder wie date (Datum), name, invoice-no (Rechnungsnummer) und total (Summe) erstellen. Stellen Sie sicher, dass Sie den Inhaltstyp entsprechend ändern – date (Datum), name (Zeichenfolge), invoice-no (Zeichenfolge) und total (Zahl).

Beschriften von Dokumenten

Jetzt können Sie mit der Beschriftung der Dokumente beginnen.

Wählen Sie oben die Taste Vorhersage Vorhersagesymbol , um anhand des Basisrechnungsmodells die Beschriftung für die definierten Felder vorherzusagen, und korrigieren Sie diese, falls die Vorhersage falsch ist.

Um die Beschriftung zu ändern, ziehen Sie die Maus über das Feld und drücken Sie auf der Tastatur die Tastenkombination, um es zu beschriften.

Verwenden Sie den Pfeil oben, um zum nächsten Dokument zu wechseln, bis Sie die Validierung der Beschriftungen für alle hochgeladenen Rechnungen abgeschlossen haben.

Hinweis: Da das Basismodell „Invoices“ bereits sehr gut funktioniert hat und die Beispielrechnung relativ einfach ist und keine übermäßigen Unregelmäßigkeiten hat, liegt die Vorhersagegenauigkeit in diesem Fall bei nahezu 100 %. So müssen Sie möglicherweise gar keine Beschriftungen korrigieren.

Exportieren von Dokumenten

Stellen Sie sicher, dass Sie den richtigen Dataset im Datasetfilter ausgewählt haben, und wählen Sie die Taste Exportieren.
Wählen Sie Exportieren aus.
Gehen Sie unter demselben Projekt in AI Center zu Datasets, wo Sie den exportierten Trainingsdataset sehen können.

Trainieren eines benutzerdefinierten Modells im AI Center

Wechseln Sie zu Pipelines > Neue erstellen. Wählen Sie den Typ der Auswertungsausführung sowie das Modellpaket und den Eingabedatensatz aus.
Wählen Sie den Unterordner unter „Export“ als Eingabe-Dataset aus.
Klicken Sie auf Erstellen, um die Pipeline zu starten. Die Ausführung der Pipeline auf CPU-Maschinen kann 1–2 Stunden dauern.

Bereitstellen des neu trainierten ML-Modells als ML-Fähigkeit

Rufen Sie ML-Fähigkeiten auf und erstellen Sie eine neue ML-Fähigkeit.

Wählen Sie dasselbe Rechnungsmodellpaket aus, das zuvor erstellt wurde. Da wir das Modell neu trainiert haben, gibt es jetzt eine neue Nebenpaketversion (1 statt 0). Wählen Sie hierbei die neueste aus.

Sobald die ML-Fähigkeit erstellt wurde, gehen Sie zu Aktuelle Bereitstellung ändern, um die ML-Fähigkeit öffentlich zu machen. Schalten Sie den Schalter um und wählen Sie Bestätigen.

Kopieren Sie die URL der öffentlichen ML-Fähigkeit zur späteren Verwendung.

Herzlichen Glückwunsch! Sie haben nun ein Invoice-Modell mit Ihrem eigenen Datensatz neu trainiert und den Endpunkt erstellt, um auf das Modell zuzugreifen.

Auf dieser Seite