Document Understanding

2021.10

False

Document Understanding-Benutzerhandbuch.

Letzte Aktualisierung 28. Feb. 2024

Data Manager

Auf dieser Seite wird beschrieben, wie der Data Manager zum Beschriften ein neues Dataset und zum erneuten Trainieren eines ML-Modells verwendet wird.

Aufrufen und Konfigurieren des Data Managers

Starten Sie die erstellte Datenbeschriftungssitzung unter First Run Experience und wechseln Sie zu den Einstellungen, um die OCR zu konfigurieren.

Wählen Sie die OCR, die Sie verwenden möchten, im Dropdownmenü OCR-Methode aus. Fügen Sie für UiPathDocumentOCR den Document Understanding-Lizenzschlüssel ein (rufen Sie den Document Understanding-API-Schlüssel von der Seite unter Admin > Lizenz ab) und fügen Sie dann die OCR-URL ein, die Sie bei der Bereitstellung von UiPathDocumentOCR generiert haben.

Konfigurieren Sie die Vorbeschriftung mit den Modellen, die Sie gemäß den Anweisungen hier bereitgestellt haben. Fügen Sie das Modell für den Endpunkt der öffentlichen ML-Fähigkeit und den Document Understanding-Lizenzschlüssel ein und klicken Sie auf Speichern.

Weitere Informationen finden Sie in der Dokumentation hier: .

Importieren von Dokumenten

Klicken Sie in einer Data Manager Sitzung auf die Schaltfläche Importieren .

Benennen Sie das Dataset und klicken Sie auf Dateien zum Hochladen durchsuchen.

Wählen Sie das Dokument aus, das Sie hochladen möchten.

Klicken Sie auf JA.

Weitere Informationen finden Sie in der Dokumentation hier: Importieren von Dokumenten.

Erstellen von Extraktionsfeldern

Klicken Sie hier , um Felder zu erstellen, die extrahiert werden sollen.

Sie können bis zu 40 Felder erstellen.

Für diese Validierungsübung können Sie einige gängige Rechnungsfelder wie date (Datum), name, invoice-no (Rechnungsnummer) und total (Summe) erstellen. Stellen Sie sicher, dass Sie den Inhaltstyp entsprechend ändern – date (Datum), name (Zeichenfolge), invoice-no (Zeichenfolge) und total (Zahl).

Weitere Informationen finden Sie in der Dokumentation hier: Erstellen und Konfigurieren von Feldern.

Beschriften von Dokumenten

Jetzt können Sie mit der Beschriftung der Dokumente beginnen.

Klicken Sie oben auf die Schaltfläche Vorhersage , um das Basis-Rechnungsmodell zu verwenden und damit die Beschriftungen für die definierten Felder vorherzusagen und sie zu korrigieren, wenn die Vorhersage falsch ist.

Um die Beschriftung zu ändern, ziehen Sie den Mauszeiger über das Feld und drücken Sie die Kurzwahltaste, um sie zu beschriften (z. B. d für das Beschriftungsdatum im folgenden Beispiel).

Verwenden Sie den Pfeil oben, um zum nächsten Dokument zu wechseln, bis Sie die Validierung der Beschriftungen für alle hochgeladenen Rechnungen abgeschlossen haben.

Hinweis: Da das Basismodell „Invoices“ bereits sehr gut funktioniert hat und die Beispielrechnung relativ einfach ist und keine übermäßigen Unregelmäßigkeiten hat, liegt die Vorhersagegenauigkeit in diesem Fall bei nahezu 100 %. So müssen Sie möglicherweise gar keine Beschriftungen korrigieren.

Weitere Informationen zum Beschriften von Dokumenten finden Sie in der Dokumentation hier: Beschriften von Dokumenten.

Exportieren von Dokumenten

Wählen Sie das richtige Dataset in der Dataset-Filterung aus und klicken Sie auf die Schaltfläche Exportieren .

Klicken Sie auf Exportieren.

Wechseln Sie unter demselben AI Center-Projekt zu Datasets. Dort sollten Sie das exportierte Trainings-Dataset sehen können.

Weitere Informationen finden Sie in der Dokumentation: Exportieren von Dokumenten.

Trainieren eines benutzerdefinierten Modells im AI Center

Wechseln Sie zu Pipelines > Neue erstellen. Wählen Sie den Typ der Auswertungsausführung sowie das Modellpaket und den Eingabedatensatz aus.

Wählen Sie den Unterordner unter „Export“ als Eingabe-Dataset aus.

Klicken Sie auf Erstellen, um die Pipeline zu starten. Die Ausführung der Pipeline auf CPU-Maschinen kann 1–2 Stunden dauern.

Bereitstellen des neu trainierten ML-Modells als ML-Fähigkeit

Rufen Sie ML-Fähigkeiten auf und erstellen Sie eine neue ML-Fähigkeit.

Wählen Sie dasselbe Rechnungsmodellpaket aus, das zuvor erstellt wurde. Da wir das Modell neu trainiert haben, gibt es jetzt eine neue Nebenpaketversion (1 statt 0). Wählen Sie hierbei die neueste aus.

Sobald die ML-Fähigkeit erstellt wurde, wechseln Sie zu Aktuelle Bereitstellung ändern, um die ML-Fähigkeit öffentlich zu machen. Schalten Sie den Umschalter um und klicken Sie auf Bestätigen.

Kopieren Sie die URL der öffentlichen ML-Fähigkeit zur späteren Verwendung.

Herzlichen Glückwunsch! Sie haben nun ein Invoice-Modell mit Ihrem eigenen Datensatz neu trainiert und den Endpunkt erstellt, um auf das Modell zuzugreifen.

Auf dieser Seite