- Überblick
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- Übersicht zur Dokumentklassifizierung
- „Klassifizierer konfigurieren“-Assistent von Classify Document Scope
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Intelligenter Schlüsselwortklassifizierer
- FlexiCapture Classifier
- Machine Learning Classifier
- Dokumentklassifizierung – verwandte Aktivitäten
- Datenverbrauch
- ML-Pakete
- Pipelines
- Dokumentmanager
- OCR-Dienste
- Document Understanding – in der Automation Suite bereitgestellt
- Document Understanding – im eigenständigen AI Center bereitgestellt
- Deep Learning
- Lizenzierung
- Referenzen
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)
Document Understanding-Benutzerhandbuch.
Über Document Manager
Der UiPath Document Manager ist eine einfache Webanwendung, mit der Benutzer Datensätze vorbereiten, überprüfen und korrigieren können, die für das Training und die Bewertung von Document Understanding-Machine Learning-Modellen erforderlich sind. Mit ihm können mehrere Benutzer verschiedene Vorgänge durchführen:
Felder definieren und konfigurieren, die von einem ML-Modell extrahiert werden sollen.
Importieren Sie Dokumente zum Hinzufügen von Beschriftungen.
Vorbeschriften von Dokumenten mit einem bereits vorhandenen ML-Modell wie Rechnungsextraktion oder Belegextraktion, die von UiPath vorgefertigt bereitgestellt werden, oder mit einem Modell, das mit AI Center trainiert wurde.
Beschriften Sie die Dokumente.
Dokumente in dem Format exportieren, das von den AI Center-Trainingspipelines erwartet wird.
Die Document Manager-Schnittstelle enthält die folgenden Panels:
Wird oben auf der Seite im Document Manager angezeigt.
Ermöglicht Ihnen die Durchführung mehrerer Vorgänge: Navigieren zwischen Dokumenten, Löschen/Wiederherstellen eines Dokuments, Filtern/Durchsuchen von Dokumenten, Ausführen von KI-Modellvorhersagen, Importieren und Exportieren von Dokumenten.
Die folgenden Optionen finden sich in der Verwaltungsleiste:
Element |
Symbol |
Beschreibung |
---|---|---|
Navigation |
|
Navigieren Sie zwischen Dokumenten, die mit dem aktiven Filter übereinstimmen. Zwischen den beiden Pfeilen wird ein Zähler angezeigt. Er zeigt die Nummer des aktuellen Dokuments aus der Gesamtzahl der Dokumente, die dem aktiven Filter bzw. der aktiven Suche entsprechen. |
|
|
Durchsuchen bzw. Filtern von Dokumenten. Der Filter wird auch beim Exportieren von Dokumenten angewendet. Sie können auch nach Wörtern aus einem Dokument oder nach Dokumentnamen filtern. |
Löschen / Wiederherstellen |
/ |
Zum Löschen oder Wiederherstellen eines Dokuments. Gelöschte Dokumente finden Sie unter dem Filter gelöscht. |
|
|
Öffnen Sie das Dialogfeld Daten importieren. |
|
|
Öffnen Sie das Dialogfeld Dateien exportieren. |
Dokumentname und -typ |
n. a. |
Der Name des aktuell aktiven Dokuments und sein Typ. Es gibt drei Arten von Dokumenten:
Trainings- und Validierungsdokumente sind Teil von Trainingsdatensätzen, die von Trainingspipelines verwendet werden. Auswertungsdokumente werden von Trainingspipelines ignoriert und sollen nur von Auswertungspipelines im AI Center verwendet werden. Diese Dokumente sind diejenigen, die als Auswertung markiert wurden (durch Aktivieren des Kontrollkästchens Zu einem Auswertungssatz machen im Dialogfeld Daten importieren). |
Herunterladen (Download) |
|
Die Option erscheint in der Dropdownliste neben dem Dokumentnamen. Klicken Sie auf das Symbol, um eine ZIP-Datei mit dem Originaldokument herunterzuladen. Neben dem Originaldokument werden auch alle Seiten, die intern vom Document Manager in das Format
.jpeg konvertiert wurden, heruntergeladen.
|
Endgültig löschen |
|
Die Option erscheint in der Dropdownliste neben dem Dokumentnamen. Endgültiges Löschen einzelner Dateien. Das
.pdf und alle seine Bilder im Format .jpeg werden aus dem AI Center-Dataset gelöscht. Alle Metadaten werden aus der Datenbank gelöscht.
Wenn Sie auf die Schaltfläche klicken, wird eine Popup-Meldung angezeigt, in der Sie gefragt werden, ob Sie das Dokument endgültig löschen möchten. Klicken Sie auf OK, um fortzufahren, oder auf Abbrechen, um zum vorherigen Bildschirm zurückzusetzen. |
Sitzungsname |
n. a. |
Der Name der aktuellen Sitzung. |
Predict |
|
Führen Sie KI-Modellvorhersagen aus und zeigen Sie die Ergebnisse an. Nach dem Konfigurieren der Vorbeschriftung ist die entsprechende Schaltfläche in der Verwaltungsleiste aktiviert. Klicken Sie darauf, um das aktuelle Dokument vorzubeschriften. Mit der Option Vorhersage können Sie mit öffentlichen Endpunkten nur die ersten 10 Seiten eines Dokuments vorbeschriften. Das ist ein bekanntes Problem, für das wir bereits an einer Lösung arbeiten. Die Verwendung der Option Vorhersage mit ML-Fähigkeiten im AI Center bringt jedoch keine solche Einschränkung mit sich. |
Einstellungen |
|
Konfigurieren Sie OCR- und Vorbeschriftungseinstellungen oder öffnen Sie den Bereich Anleitungen zu.... Weitere Informationen finden Sie unten. |
Optionen „Löschen“ und „Endgültiges Löschen“
Sehen wir uns den Unterschied zwischen den Optionen Löschen und Endgültig löschen etwas genauer an.
- Die Option Löschen löscht die Dateien, entfernt sie jedoch nicht vollständig aus Ihrem Projekt. Die gelöschten Dateien können weiterhin unter dem gelöschten Filter in der Suchleiste gefunden und mit der Option Wiederherstellen wiederhergestellt werden.
- Die Option Endgültig löschen löscht die ausgewählten Dateien, ohne dass sie wiederhergestellt werden können.
Beachten Sie die Verwendung beider Optionen im folgenden GIF:
Suchoption
Die Suchleiste ist sowohl ein Texteingabefeld als auch eine Dropdown-Liste.
Suchoptionen können eingegeben werden, indem Sie entweder in die Suchleiste schreiben oder einen Filter aus der Dropdownliste auswählen. Es gibt drei Hauptmethoden zum Initialisieren einer Suche:
- Verwenden Sie die integrierten Filter, die in der Dropdownliste der Suchleiste verfügbar sind. Sie können einen der folgenden Filter auswählen: train-set, validate-set, train-validate-set, evaluation-set, deleted, labelled, unlabelled.
Hinweis: Bitte beachten Sie, dass für Forms AI nur die folgenden integrierten Filter verfügbar sind: deleted, labelled, unlabelled.
- Verwenden der Importbatchnamen. Diese sind auch in der Dropdownliste der Suchleiste verfügbar. Bei manueller Eingabe ist das Format
batch:name
, wobeiname
durch den Namen ersetzt wird, den Sie einem Batch beim Import gegeben haben, z. B.batch:invoices1
- Verwenden von Schlüsselwörtern. Sie müssen das/die Schlüsselwort(e) als freien Text in die Suchleiste eingeben. Die Suche erfolgt nach dem/den Schlüsselwort(en) im Inhalt eines Dokuments oder im Dokumentnamen.
Sie können eine oder mehrere Suchoptionen verwenden. Mit jeder zusätzlichen Option wird die Suche spezifischer. Hier sind einige Suchbeispiele, die zunächst breit gefächert sind und langsam zu einer verfeinerten Suche übergehen:
- Beim Initiieren einer
labelled
-Suche werden allelabelled
-Dokumente im Dataset zurückgegeben. - Beim Initiieren einer
batch:invoices1
-Suche werden alle Dokumente zurückgegeben, die Teil desinvoices1
-Batches sind. - Beim Starten einer
labelled batch:invoices1
-Suche werden alle Dokumente zurückgegeben, die Teil desinvoices1
-Batches sind. - Das Auslösen einer
labelled batch:invoices1 vermont
-Suche liefert alle beschrifteten Dokumente aus dem Stapelinvoices1
, die das eingegebene Schlüsselwort, in diesem Fallvermont
, entweder im Dokumentnamen oder im Dokumentinhalt enthalten.
Die Suchleiste verfügt über ein Dropdownmenü, das beim Öffnen die folgenden Filter anzeigt:
- train-set – Gibt die Anzahl der Dokumente an, die zum Trainieren des Modells verwendet werden sollen. Automatisierte Aktion.
- validate-set – Gibt die Anzahl der Dokumente an, die zum Validieren des Modells nach Abschluss des Trainings verwendet werden sollen. Die Aufteilung zwischen Trainings- und Validierungssatz soll 80 %–20 % betragen. Automatisierte Aktion.
- train-validate-set – Gibt die Anzahl der Dokumente an, die sowohl im Filter train-set als auch im Filter validate-set gefunden wurden. Automatisierte Aktion.
- Auswertungssatz (evaluation-set) – Gibt die Anzahl der Dokumente an, bei denen während des Imports das Kontrollkästchen für den Auswertungssatz aktiviert wurde und die für die Auswertung des Modells in der Phase der Trainingspipeline verwendet werden sollen. Weitere Informationen finden Sie hier. Manuelle Aktion.
- deleted – Gibt die Anzahl der gelöschten Dokumente an. Weitere Informationen finden Sie hier.
- labelled – Gibt die Anzahl der Dokumente an, die Beschriftungen haben. Eine Beschriftung wird durch mindestens ein mit Tags versehenes/manuell bearbeitetes Feld pro Dokument definiert.
- unlabelled – Gibt die Anzahl der Dokumente an, die keine Beschriftungen haben.
- batch:name – Gibt die Dokumente an, die im selben Importvorgang enthalten sind.
Die Zuweisung eines Dokuments zu den Trainings- oder Validierungssätzen erfolgt durch die Anwendung zum Zeitpunkt des Imports.
Das importierte Dokument landet im Auswertungssatz, wenn das Kontrollkästchen „Auswertungssatz“ während des Imports aktiviert ist.
Einstellungsmenü
Die Schaltfläche „Settings“ verfügt über zwei Optionen:
- Settings, wo Sie die OCR oder Vorbeschriftung konfigurieren können.
- Anleitungen zu … mit dem Zweck eines Hilfemenüs
Um Dokumente in den Document Manager zu importieren, müssen Sie einen OCR-Dienst konfigurieren.
Die folgenden Optionen sind verfügbar:
OCR-Methode
Die cloudbasierten Optionen sind:
- UiPath Document OCR – https://du.uipath.com/ocr;
- Google Cloud Vision OCR hat die beste Sprachabdeckung
- Google Cloud Vision OCR for Japanese ist optimal zum Lesen japanischer Dokumente
- Microsoft Read OCR.
OCR-URL
Zum Konfigurieren der OCR muss der OCR Dienst über eine URL verfügen. Hier sind die möglichen URLs, die Sie verwenden können:
- öffentliche URLs wie etwa https://du.uipath.com/ocr oder Drittanbieter-URLs von Google Vision OCR oder Microsoft Read OCR
OCR-Schlüssel
Der entsprechende API-Schlüssel für das ausgewählte OCR-Modul. Bei UiPath Document OCR müssen Sie beispielsweise den API-Schlüssel für Document Understanding verwenden. Obligatorisch für Document Manager-Cloud und Document Manager lokal (online). Nicht erforderlich für Document Manager lokal (air-gapped).
Vorbeschriftung
Wenn Sie bereits über ein Modell verfügen, das einige der Felder extrahieren kann, die beschriftet werden müssen, und es nur einige zusätzliche Felder gibt, die eine manuelle Beschriftung erfordern, können Sie viel Zeit sparen, indem Sie die Vorbeschriftungsfunktion des Document Managers verwenden.
Die folgenden Optionen sind verfügbar:
Vorbeschriftung der URL
Für die Vorbeschriftung ist es erforderlich, dass das ML-Modell über eine URL verfügt. Hier sind die möglichen URLs, die Sie verwenden können:
- öffentliche URLs wie https://du.uipath.com/ie/invoices oder https://du.uipath.com/ie/purchase_orders
- Eine vollständige Liste der Endpunkte finden Sie hier.
- URLs von ML-Fähigkeiten, die im lokalen AI Center oder in der AI Center Cloud öffentlich gemacht wurden
Vorbeschriftung des Schlüssels
Der API-Schlüssel für Document Understanding. Obligatorisch für Document Manager-Cloud und Document Manager lokal (online). Nicht erforderlich für Document Manager lokal (air-gapped).
Anleitungen zu …
Mit der Option Anleitungen zu... wird auf das Document Manager-Hilfemenü zugegriffen.
Hier finden Sie:
- Die Document Manager-Version
- Den Link Dokumentation, der zu dieser Dokumentationsseite führt.
- Im Abschnitt Beschriftungssteuerelemente werden die Steuerelemente angezeigt, die beim Umgang mit Daten verwendet werden sollen.
- Im Abschnitt Dokumentverknüpfungen werden die Verknüpfungen angezeigt, die zum Ausführen verschiedener Vorgänge wie Navigation und UI-Skalierung verwendet werden.
- Im Abschnitt Konfiguration werden Details zur Instanz-Konfiguration angezeigt, die während der Installation durchgeführt wurde.
Spaltenfelder haben die folgenden Optionen:
- Neues Spaltenfeld erstellen
- Feld bearbeiten
- Spaltenfeldwerte erweitern/reduzieren
Weitere Informationen zu Spaltenfeldern finden Sie in diesem Abschnitt.
Reguläre Felder haben die folgenden Optionen:
- Ein neues reguläres Feld erstellen
- Feld bearbeiten
Weitere Informationen zu regulären Feldern finden Sie in diesem Abschnitt.
Klassifizierungsfelder haben die folgenden Optionen:
- Erstellen Sie ein neues Klassifizierungsfeld.
- Feld bearbeiten
Weitere Informationen zu Klassifizierungsfeldern finden Sie in diesem Abschnitt.
Bei mehrseitigen Dokumenten können Sie natürlich wie bei jedem PDF-Anzeigeprogramm durch die Seiten scrollen. Zum Vergrößern oder Verkleinern halten Sie STRG gedrückt und scrollen mit der Maus.
Sie können Dokumente beschriften, indem Sie die Wortfelder auswählen und sie einem Feld durch Tastendruck zuweisen. Sie können auch mit der rechten Maustaste auf das Wortfeld klicken und die extrahierten Informationen überprüfen.
Weitere Informationen zum Beschriften von Dokumenten finden Sie auf dieser Seite.
Wenn Sie eine neue Document Manager-Sitzung öffnen oder einen leeren Filter haben, werden bestimmte Richtlinien in der Dokumentansicht angezeigt:
Außerdem werden Fehler beim Laden auch in der Dokumentansicht angezeigt: