- Überblick
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- ML-Pakete
- Pipelines
- Data Manager
- OCR-Dienste
- Document Understanding – in der Automation Suite bereitgestellt
- Document Understanding – im eigenständigen AI Center bereitgestellt
- Lizenzierung
- Referenzen
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)
Informationen zum Datenmanager
Der UiPath Document Manager ist eine einfache Webanwendung, mit der Benutzer Datensätze vorbereiten, überprüfen und korrigieren können, die für das Training und die Bewertung von Document Understanding-Machine Learning-Modellen erforderlich sind.
Hier sind die lokalen Bereitstellungsmethoden:
- Data Manager im AI Center (lokal). Dies ist allgemein verfügbar und wird für Produktionsszenarien vollständig unterstützt. Es gibt keine Beschränkung für die Größe der zu importierenden Datensätze. Ausnahme: das automatische erneute Training, bei dem noch das Limit von 2000 Seiten bzw. 2 GB pro Import gilt. Alle für lokale Installationen verfügbaren AI Center-Bereitstellungsmethoden finden Sie auf dieser Seite.
Data Manager ermöglicht mehreren Benutzern die Durchführung einer Vielzahl von Vorgängen, die mit der Verwaltung von Datenbatches, der Datenvorbereitung und der Modellkonfiguration verbunden sind:
Felder definieren und konfigurieren, die von einem ML-Modell extrahiert werden sollen.
Importieren Sie Dokumente zum Hinzufügen von Beschriftungen.
Vorbeschriften von Dokumenten mit einem bereits vorhandenen ML-Modell wie Rechnungsextraktion oder Belegextraktion, die von UiPath vorgefertigt bereitgestellt werden, oder mit einem Modell, das mit AI Center trainiert wurde.
Beschriften Sie die Dokumente.
Dokumente in dem Format exportieren, das von den AI Center-Trainingspipelines erwartet wird.
Die Data Manager-Schnittstelle enthält die folgenden Panels:
Wird oben auf der Seite in Data Manager angezeigt.
Ermöglicht Ihnen die Durchführung mehrerer Vorgänge: Navigieren zwischen Dokumenten, Löschen/Wiederherstellen eines Dokuments, Filtern/Durchsuchen von Dokumenten, Ausführen von KI-Modellvorhersagen, Importieren und Exportieren von Dokumenten.
Hier sind die Optionen, die in der Verwaltungsleiste verfügbar sind:
Option |
Symbol |
Beschreibung |
---|---|---|
Navigation |
|
Navigieren Sie zwischen Dokumenten, die mit dem aktiven Filter übereinstimmen. Zwischen den beiden Pfeilen wird ein Zähler angezeigt. Er zeigt die Nummer des aktuellen Dokuments aus der Gesamtzahl der Dokumente, die dem aktiven Filter bzw. der aktiven Suche entsprechen. |
|
Durchsuchen bzw. Filtern von Dokumenten. Der Filter wird auch beim Exportieren von Dokumenten angewendet. Sie können auch nach Wörtern aus einem Dokument oder nach Dokumentnamen filtern. | |
Löschen / Wiederherstellen |
/ |
Zum Löschen oder Wiederherstellen eines Dokuments. Gelöschte Dokumente finden Sie unter dem Filter gelöscht. |
Predict |
|
Führen Sie KI-Modellvorhersagen aus und zeigen Sie die Ergebnisse an. Nach dem Konfigurieren der Vorbeschriftung ist die entsprechende Schaltfläche in der Verwaltungsleiste aktiviert. Klicken Sie darauf, um das aktuelle Dokument vorzubeschriften. Mit der Option Vorhersage können Sie mit öffentlichen Endpunkten nur die ersten 10 Seiten eines Dokuments vorbeschriften. Das ist ein bekanntes Problem, für das wir bereits an einer Lösung arbeiten. Die Verwendung der Option Vorhersage mit ML-Fähigkeiten im AI Center bringt jedoch keine solche Einschränkung mit sich. |
|
Öffnen Sie das Dialogfeld Daten importieren. | |
|
Öffnen Sie das Dialogfeld Dateien exportieren. | |
|
Klicken Sie auf das Symbol, um eine ZIP-Datei mit dem Originaldokument herunterzuladen. | |
|
Konfigurieren Sie OCR- und Vorbeschriftungseinstellungen oder greifen Sie auf das Panel Anleitungen zu... zu. Siehe unten. |
Herunterladen (Download)
.jpeg
-Bilder konvertiert wurden, heruntergeladen.
Dokumentname, Typ und Sitzungsname
Auf der rechten Seite des Symbols sehen Sie den Namen des aktuell aktiven Dokuments, seinen Typ und den Sitzungsnamen.
Es gibt drei Arten von Dokumenten:
- Trainingsdokument
- Validierungsdokument
- Auswertungsdokument
Trainings- und Validierungsdokumente sind Teil von Trainingsdatensätzen, die von Trainingspipelines verwendet werden.
Auswertungsdokumente werden von Trainingspipelines ignoriert und sollen nur von Auswertungspipelines im AI Center verwendet werden. Diese Dokumente sind diejenigen, die als Auswertung markiert wurden (durch Aktivieren des Kontrollkästchens Zu einem Auswertungssatz machen im Dialogfeld Daten importieren).
Einstellungen
Die Schaltfläche „Settings“ verfügt über zwei Optionen:
- Einstellungen zum Konfigurieren des OCR-Diensts oder der Vorbeschriftung
- Anleitungen zu … mit dem Zweck eines Hilfemenüs
OCR
Um Dokumente in Data Manager zu importieren, müssen Sie einen OCR-Dienst konfigurieren.
Die folgenden Optionen sind verfügbar:
Die Auswahl der OCR-Engine, die zum Importieren von Dokumenten in Data Manager verwendet werden soll, ist eine kritische Entscheidung.
Es wird empfohlen, die gleiche OCR zum Importieren von Trainingsdaten (Trainingszeit) wie zum Bereitstellen des Modells zu verwenden (Ausführungszeit).
Idealerweise sollten Sie einige verschiedene ausprobieren, um zu sehen, welche am besten bei Ihren Dokumenten funktioniert, und erst dann entscheiden.
Die lokalen Optionen sind:
- UiPath OCR-Container, der die wichtigsten westeuropäischen Sprachen unterstützt;
- Microsoft Read-Container (verfügbar als Vorschau von Microsoft), auch mit einer guten Sprachabdeckung;
- UiPath OCR ML-Fähigkeiten, die im lokalen AI Center v2020.10 oder höher bereitgestellt werden.
Die cloudbasierten Optionen sind:
- UiPath Document OCR – https://du.uipath.com/ocr;
- Google Cloud Vision OCR hat die beste Sprachabdeckung
- Google Cloud Vision OCR for Japanese ist optimal zum Lesen japanischer Dokumente
- Microsoft Read OCR.
Zum Konfigurieren der OCR muss der OCR Dienst über eine URL verfügen. Hier sind die möglichen URLs, die Sie verwenden können:
- öffentliche URLs wie etwa https://du.uipath.com/ocr oder Drittanbieter-URLs von Google Vision OCR oder Microsoft Read OCR
- URLs von UiPath Document OCR (eigenständiger Container), der von UiPath vor Ort bereitgestellt wird
-
URLs vom OCR-ML-Paket, das als ML-Fähigkeiten bereitgestellt wurde und im lokalen AI Center v2020.10 oder höher öffentlich gemacht wurde.
Wichtig:Wenn Sie OCR auf der gleichen Maschine wie Data Manager ausführen, verwenden Sie nichtlocalhost
, um auf die lokale Maschine zu verweisen, sondern verwenden Sie die IP-Adresse oder den Domänennamen der lokalen Maschine.Verwenden Sie bei URLs von OCR, die als öffentliche ML-Fähigkeit im lokalen AI Center bereitgestellt wird, die URL, so wie sie in AI Center auf dem Bildschirm mit den Details zu den ML-Fähigkeiten angezeigt wird.
Der entsprechende API-Schlüssel für das ausgewählte OCR-Modul. Bei UiPath Document OCR müssen Sie beispielsweise den API-Schlüssel für Document Understanding verwenden. Obligatorisch für Data Manager Cloud und Data Manager (lokal) Online. Nicht erforderlich für Data Manager (lokal, air-gapped).
Vorbeschriftung
Wenn Sie bereits über ein Modell verfügen, das einige der Felder extrahieren kann, die beschriftet werden müssen, und es nur einige zusätzliche Felder gibt, die eine manuelle Beschriftung erfordern, können Sie viel Zeit sparen, indem Sie die Vorbeschriftungsfunktion von Data Manager verwenden.
Die folgenden Optionen sind verfügbar:
Für die Vorbeschriftung ist es erforderlich, dass das ML-Modell über eine URL verfügt. Hier sind die möglichen URLs, die Sie verwenden können:
- öffentliche URLs wie https://du.uipath.com/ie/invoices oder https://du.uipath.com/ie/purchase_orders
- Eine vollständige Liste der Endpunkte finden Sie hier.
- URLs von ML-Fähigkeiten, die im lokalen AI Center oder in der AI Center Cloud öffentlich gemacht wurden
ML-Fähigkeiten im lokalen AI Center, die in Air-gapped-Umgebungen bereitgestellt werden, können nicht für die Vorbeschriftung verwendet werden.
localhost
, um auf die lokale Maschine zu verweisen, sondern verwenden Sie die IP-Adresse oder den Domänennamen der lokalen Maschine.
Verwenden Sie bei URLs von öffentlichen ML-Fähigkeiten im lokalen AI Center die URL, so wie sie in AI Center auf dem Bildschirm mit den Details zu den ML-Fähigkeiten angezeigt wird.
Der API-Schlüssel für Document Understanding. Obligatorisch für Data Manager Cloud und Data Manager (lokal) Online. Nicht erforderlich für Data Manager (lokal, air-gapped).
Anleitungen zu …
Mit der Option Anleitungen zu... wird auf das Data Manager-Hilfemenü zugegriffen.
Hier finden Sie:
- Die Data Manager-Version
- Den Link Dokumentation, der zu dieser Dokumentationsseite führt.
- Im Abschnitt Beschriftungssteuerelemente werden die Steuerelemente angezeigt, die beim Umgang mit Daten verwendet werden sollen.
- Im Abschnitt Dokumentverknüpfungen werden die Verknüpfungen angezeigt, die zum Ausführen verschiedener Vorgänge wie Navigation und UI-Skalierung verwendet werden.
- Im Abschnitt Konfiguration werden Details zur Instanz-Konfiguration angezeigt, die während der Installation durchgeführt wurde.
Spaltenfelder haben die folgenden Optionen:
- Neues Spaltenfeld erstellen
- Feld bearbeiten
- Spaltenfeldwerte erweitern/reduzieren
Weitere Informationen zu Spaltenfeldern finden Sie in diesem Abschnitt.
Reguläre Felder haben die folgenden Optionen:
- Ein neues reguläres Feld erstellen
- Feld bearbeiten
Weitere Informationen zu regulären Feldern finden Sie in diesem Abschnitt.
Klassifizierungsfelder haben die folgenden Optionen:
- Erstellen Sie ein neues Klassifizierungsfeld.
- Feld bearbeiten
Weitere Informationen zu Klassifizierungsfeldern finden Sie in diesem Abschnitt.
Bei mehrseitigen Dokumenten können Sie natürlich wie bei jedem PDF-Anzeigeprogramm durch die Seiten scrollen. Zum Vergrößern oder Verkleinern halten Sie STRG gedrückt und scrollen mit der Maus.
Sie können Dokumente beschriften, indem Sie die Wortfelder auswählen und sie einem Feld durch Tastendruck zuweisen. Sie können auch mit der rechten Maustaste auf das Wortfeld klicken und die extrahierten Informationen überprüfen.
Weitere Informationen zum Beschriften von Dokumenten finden Sie auf dieser Seite.
Wenn Sie eine neue Data Manager-Sitzung öffnen oder einen leeren Filter haben, werden bestimmte Richtlinien in der Dokumentansicht angezeigt:
Außerdem werden Fehler beim Laden auch in der Dokumentansicht angezeigt: