- Überblick
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- ML-Pakete
- Pipelines
- Dokumentmanager
- OCR-Dienste
- Document Understanding – in der Automation Suite bereitgestellt
- Document Understanding – im eigenständigen AI Center bereitgestellt
- Deep Learning
- Lizenzierung
- Referenzen
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)
Document Understanding-Benutzerhandbuch.
Verwenden von Document Manager
Auf dieser Seite wird beschrieben, wie der Document Manager zum Beschriften eines neuen Datasets und zum erneuten Trainieren eines ML-Modells verwendet wird.
Starten Sie die erstellte Datenbeschriftungssitzung unter First Run Experience und wechseln Sie zu den Einstellungen, um die OCR zu konfigurieren.
Wählen Sie die OCR, die Sie verwenden möchten, im Dropdownmenü OCR-Methode aus. Fügen Sie für UiPathDocumentOCR den Document Understanding-Lizenzschlüssel ein (rufen Sie den Document Understanding-API-Schlüssel von der Seite unter Admin > Lizenz ab) und fügen Sie dann die OCR-URL ein, die Sie bei der Bereitstellung von UiPathDocumentOCR generiert haben.
Konfigurieren Sie die Vorbeschriftung mit den Modellen, die Sie gemäß den Anweisungen hier bereitgestellt haben. Fügen Sie das Modell für den Endpunkt der öffentlichen ML-Fähigkeit und den Document Understanding-Lizenzschlüssel ein und klicken Sie auf Speichern.
Klicken Sie in einer Document Manager-Sitzung auf die Schaltfläche Importieren .
Benennen Sie das Dataset und klicken Sie auf Dateien zum Hochladen durchsuchen.
Wählen Sie das Dokument aus, das Sie hochladen möchten.
Klicken Sie auf JA.
Klicken Sie hier , um Felder zu erstellen, die extrahiert werden sollen.
Sie können bis zu 40 Felder erstellen.
Für diese Validierungsübung können Sie einige gängige Rechnungsfelder wie date (Datum), name, invoice-no (Rechnungsnummer) und total (Summe) erstellen. Stellen Sie sicher, dass Sie den Inhaltstyp entsprechend ändern – date (Datum), name (Zeichenfolge), invoice-no (Zeichenfolge) und total (Zahl).
Jetzt können Sie mit der Beschriftung der Dokumente beginnen.
Klicken Sie oben auf die Schaltfläche Vorhersage , um das Basis-Rechnungsmodell zu verwenden und damit die Beschriftungen für die definierten Felder vorherzusagen und sie zu korrigieren, wenn die Vorhersage falsch ist.
d
für das Beschriftungsdatum im folgenden Beispiel).
Verwenden Sie den Pfeil oben, um zum nächsten Dokument zu wechseln, bis Sie die Validierung der Beschriftungen für alle hochgeladenen Rechnungen abgeschlossen haben.
Wählen Sie das richtige Dataset in der Dataset-Filterung aus und klicken Sie auf die Schaltfläche Exportieren .
Klicken Sie auf Exportieren.
Wechseln Sie unter demselben AI Center-Projekt zu Datasets. Dort sollten Sie das exportierte Trainings-Dataset sehen können.
Trainieren eines benutzerdefinierten Modells im AI Center
Wechseln Sie zu Pipelines > Neue erstellen. Wählen Sie den Typ der Auswertungsausführung sowie das Modellpaket und den Eingabedatensatz aus.
Wählen Sie den Unterordner unter „Export“ als Eingabe-Dataset aus.
Klicken Sie auf Erstellen, um die Pipeline zu starten. Die Ausführung der Pipeline auf CPU-Maschinen kann 1–2 Stunden dauern.
Rufen Sie ML-Fähigkeiten auf und erstellen Sie eine neue ML-Fähigkeit.
Wählen Sie dasselbe Rechnungsmodellpaket aus, das zuvor erstellt wurde. Da wir das Modell neu trainiert haben, gibt es jetzt eine neue Nebenpaketversion (1 statt 0). Wählen Sie hierbei die neueste aus.
Sobald die ML-Fähigkeit erstellt wurde, wechseln Sie zu Aktuelle Bereitstellung ändern, um die ML-Fähigkeit öffentlich zu machen. Schalten Sie den Umschalter um und klicken Sie auf Bestätigen.
Kopieren Sie die URL der öffentlichen ML-Fähigkeit zur späteren Verwendung.
Herzlichen Glückwunsch! Sie haben nun ein Invoice-Modell mit Ihrem eigenen Datensatz neu trainiert und den Endpunkt erstellt, um auf das Modell zuzugreifen.