- Überblick
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- Übersicht zur Dokumentklassifizierung
- „Klassifizierer konfigurieren“-Assistent von Classify Document Scope
- FlexiCapture Classifier
- Intelligenter Schlüsselwortklassifizierer
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Machine Learning Classifier
- Dokumentklassifizierung – verwandte Aktivitäten
- ML-Pakete
- Überblick
- Document Understanding – ML-Paket
- DocumentClassifier – ML-Paket
- ML-Pakete mit OCR-Funktionen
- 1040 – ML-Paket
- 4506T – ML-Paket
- 990 – ML-Paket – Vorschau
- ACORD125 – ML-Paket
- ACORD126 – ML-Paket
- ACORD131 – ML-Paket
- ACORD140 – ML-Paket
- ACORD25 – ML-Paket
- Bank Statements – ML-Paket
- BillsOfLading – ML-Paket
- Certificate of Incorporation – ML-Paket
- Certificates of Origin – ML-Paket
- Checks – ML-Paket
- Children Product Certificate – ML-Paket
- CMS1500 – ML-Paket
- EU Declaration of Conformity – ML-Paket
- Financial Statements – ML-Paket
- FM1003 – ML-Paket
- I9 – ML-Paket
- ID Cards – ML-Paket
- Invoices – ML-Paket
- InvoicesAustralia – ML-Paket
- InvoicesChina – ML-Paket
- InvoicesIndia – ML-Paket
- InvoicesJapan – ML-Paket
- Invoices Shipping – ML-Paket
- Packing Lists – ML-Paket
- Passports – ML-Paket
- Gehaltsabrechnungen (Pay slips) – ML-Paket
- Purchase Orders – ML-Paket
- Receipts – ML-Paket
- RemittanceAdvices – ML-Paket
- Utility Bills – ML-Paket
- Vehicle Titles – ML-Paket
- W2 – ML-Paket
- W9 – ML-Paket
- Andere out-of-the-box ML-Pakete
- Öffentliche Endpunkte
- Hardwareanforderungen
- Pipelines
- Dokumentmanager
- OCR-Dienste
- Deep Learning
- Document Understanding – in der Automation Suite bereitgestellt
- Document Understanding – im eigenständigen AI Center bereitgestellt
- Lizenzierung
- Aktivitäten
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)
Document Understanding-Benutzerhandbuch.
Die Benutzeroberfläche
Die Document Manager-Schnittstelle enthält die folgenden Panels:
- Verwaltungsleiste
- Spaltenfelder
- Reguläre Felder
- Klassifizierungsfelder
- Dokumentansicht
Wird oben auf der Seite im Document Manager angezeigt.
Ermöglicht Ihnen die Durchführung mehrerer Vorgänge: Navigieren zwischen Dokumenten, Löschen/Wiederherstellen eines Dokuments, Filtern/Durchsuchen von Dokumenten, Ausführen von KI-Modellvorhersagen, Importieren und Exportieren von Dokumenten.
Die folgenden Optionen finden sich in der Verwaltungsleiste:
Element |
Symbol |
Beschreibung |
---|---|---|
Navigation |
|
Navigieren Sie zwischen Dokumenten, die mit dem aktiven Filter übereinstimmen. Zwischen den beiden Pfeilen wird ein Zähler angezeigt. Er zeigt die Nummer des aktuellen Dokuments aus der Gesamtzahl der Dokumente, die dem aktiven Filter bzw. der aktiven Suche entsprechen. |
Suche |
|
Es gibt zwei Suchfunktionen:
|
Löschen / Wiederherstellen |
|
Zum Löschen oder Wiederherstellen eines Dokuments. Gelöschte Dokumente finden Sie unter dem Filter gelöscht. |
Importieren |
|
Öffnen Sie das Dialogfeld Daten importieren. |
Exportieren |
|
Öffnen Sie das Dialogfeld Dateien exportieren. |
Dokumentname und -typ |
n. a. |
Der Name des aktuell aktiven Dokuments und sein Typ. Es gibt drei Arten von Dokumenten:
Trainings- und Validierungsdokumente sind Teil von Trainingsdatensätzen, die von Trainingspipelines verwendet werden. Auswertungsdokumente werden von Trainingspipelines ignoriert und sollen nur von Auswertungspipelines im AI Center verwendet werden. Diese Dokumente sind diejenigen, die als Auswertung markiert wurden (durch Aktivieren des Kontrollkästchens Zu einem Auswertungssatz machen im Dialogfeld Daten importieren). |
Herunterladen (Download) |
Die Option erscheint in der Dropdownliste neben dem Dokumentnamen. Klicken Sie auf das Symbol, um eine ZIP-Datei mit dem Originaldokument herunterzuladen. Neben dem Originaldokument werden auch alle Seiten, die intern vom Document Manager in das Format
.jpeg konvertiert wurden, heruntergeladen.
| |
Endgültig löschen |
Die Option erscheint in der Dropdownliste neben dem Dokumentnamen. Endgültiges Löschen einzelner Dateien. Das
.pdf und alle seine Bilder im Format .jpeg werden aus dem AI Center-Dataset gelöscht. Alle Metadaten werden aus der Datenbank gelöscht.
Wenn Sie auf die Schaltfläche klicken, wird eine Popup-Meldung angezeigt, in der Sie gefragt werden, ob Sie das Dokument endgültig löschen möchten. Klicken Sie auf OK, um fortzufahren, oder auf Abbrechen, um zum vorherigen Bildschirm zurückzusetzen. | |
Batchname |
n. a. |
Der Name des aktuellen Batches. |
Sitzungsname |
n. a. |
Der Name der aktuellen Sitzung. |
Predict |
Führen Sie KI-Modellvorhersagen aus und zeigen Sie die Ergebnisse an. Nach dem Konfigurieren der Vorbeschriftung ist die entsprechende Schaltfläche in der Verwaltungsleiste aktiviert. Klicken Sie darauf, um das aktuelle Dokument vorzubeschriften. | |
Einstellungen |
Konfigurieren Sie OCR- und Vorbeschriftungseinstellungen oder öffnen Sie den Bereich Anleitungen zu.... Weitere Informationen finden Sie unten. |
Sehen wir uns den Unterschied zwischen den Optionen Löschen und Endgültig löschen etwas genauer an.
- Die Option Löschen löscht die Dateien, entfernt sie jedoch nicht vollständig aus Ihrem Projekt. Die gelöschten Dateien können weiterhin unter dem gelöschten Filter in der Suchleiste gefunden und mit der Option Wiederherstellen wiederhergestellt werden.
-
Die Option Endgültig löschen löscht die ausgewählten Dateien, ohne dass sie wiederhergestellt werden können.
Die exponierte Suchfunktion besteht aus zwei Teilen:
-
Mit den integrierten Filtern suchen: Filtert die Dokumente basierend auf den für Batches/Kategorien verfügbaren Optionen im Dropdownmenü.
Durch die Auswahl weiterer Optionen lässt sich die Suche präzisieren. Wenn Sie beispielsweise Batch-Import1 und Gelöscht auswählen, werden nur die Dokumente angezeigt, die im Batch-Import1 importiert und gelöscht wurden.
Beachten Sie Kombinationen, die immer eine leere Liste zurückgeben: Wenn Sie Batch-Import1 und Batch-Import2 auswählen, wird nie ein Dokument zurückgegeben, da die Auswahl restriktiv ist und kein Dokument gleichzeitig in zwei Batches sein kann.
-
Suche in Dokumenten mit Schlüsselwörtern: Diese Suchleiste filtert die Informationen basierend auf einer Texteingabe. Sie müssen das/die Schlüsselwort(e) als freien Text in die Suchleiste eingeben. Die Suche erfolgt nach dem/den Schlüsselwort(en) im Inhalt eines Dokuments oder im Dokumentnamen. Die Suche nach mehreren Wörtern gibt Ergebnisse zurück, bei denen die Wörter nebeneinander liegen, ohne dass dazwischen liegende Satzzeichen vorhanden sind.
-
Im Dokument suchen: Sie können ausschließlich nach Textinstanzen in Ihrem aktuellen Dokument suchen. Die Suchleiste befindet sich unten links auf dem Bildschirm.
Die Schaltfläche „Settings“ verfügt über zwei Optionen:
- Einstellungen zum Konfigurieren des OCR-Diensts oder der Vorbeschriftung
- Anleitungen zu … mit dem Zweck eines Hilfemenüs
OCR
Um Dokumente in den Document Manager zu importieren, müssen Sie einen OCR-Dienst konfigurieren.
Die folgenden Optionen sind verfügbar:
Diese Einstellung ist nur für Dokumenttypen (Data Manager-Sitzungen) verfügbar, die im AI Center erstellt wurden. Wenn diese Einstellung in Document UnderstandingTM erstellt wird, wird sie von den Projekteinstellungen geerbt. Wenn Sie diese Einstellungen in Document UnderstandingTM ändern möchten, kehren Sie zur Projektansicht zurück und öffnen Sie die Projekteinstellungen unten links.
Die cloudbasierten Optionen sind:
- UiPath® Document OCR –
https://du.uipath.com/ocr
; - OCR für Chinesisch, Japanisch und Koreanisch
- Google Cloud Vision OCR hat die beste Sprachabdeckung
- Google Cloud Vision OCR for Japanese ist optimal zum Lesen japanischer Dokumente
- Microsoft Read OCR.
Zum Konfigurieren der OCR muss der OCR Dienst über eine URL verfügen. Hier sind die möglichen URLs, die Sie verwenden können:
- öffentliche URLs wie etwa
https://du.uipath.com/ocr
oder Drittanbieter-URLs von Google Vision OCR oder Microsoft Read OCR
Der entsprechende API-Schlüssel für das ausgewählte OCR-Modul. Bei UiPath Document OCR müssen Sie beispielsweise den API-Schlüssel für Document Understanding verwenden. Obligatorisch für Document Manager-Cloud und Document Manager lokal (online). Nicht erforderlich für Document Manager lokal (air-gapped).
Weitere Informationen finden Sie auf der Seite Cloud- und lokale Nutzung.
Legt fest, ob der OCR-Prozess auf PDF-Dokumente angewendet werden soll oder nicht. Bei True wird die OCR auf allen PDF-Seiten des Dokuments angewendet. Wenn auf False festgelegt, wird nur digital eingegebener Text extrahiert. Bei Einstellung auf Automatisch wird ausgewertet, ob das Dokument abhängig vom Eingabedokument den OCR-Algorithmus anwenden muss. Der Standardwert ist Auto.
Wenn Sie bereits über ein Modell verfügen, das einige der Felder extrahieren kann, die beschriftet werden müssen, und es nur einige zusätzliche Felder gibt, die eine manuelle Beschriftung erfordern, können Sie Zeit sparen, indem Sie die Vorbeschriftungsfunktion des Document Manager verwenden.
Die Vorbeschriftung kombiniert die Ergebnisse des Vorbeschriftungsendpunkts, den Sie in den Vorbeschriftungseinstellungen konfigurieren.
Die folgenden Optionen sind verfügbar:
Für die Vorbeschriftung ist es erforderlich, dass das ML-Modell über eine URL verfügt. Sehen Sie sich die folgenden möglichen URLs an, die Sie verwenden können:
- Öffentliche URLs wie
https://du.uipath.com/ie/invoices or https://du.uipath.com/ie/purchase_orders
.Die vollständige Liste der Endpunkte finden Sie unter Öffentliche Endpunkte.
- URLs von ML-Fähigkeiten, die im lokalen AI Center oder im cloudbasierten AI Center öffentlich gemacht wurden.
Der API-Schlüssel für Document Understanding/AI Units. Der API-Schlüssel der Vorbeschriftung ist der Document Understanding-API-Schlüssel der Organisation, in der sich die Fähigkeit befindet.
Der Schlüssel ist für den cloudbasierten Document Manager und den lokalen Online Document Manager obligatorisch. Der Schlüssel ist für den lokalen Air-Gapped Document Manager optional.
Mit der Option Anleitungen zu… wird das Document Manager-Hilfemenü geöffnet.
Im Hilfemenü finden Sie die folgenden Informationen:
- Die Document Manager-Version.
- Den Link Dokumentation, der zu dieser Dokumentationsseite führt.
- Im Abschnitt Beschriftungssteuerelemente werden die Steuerelemente angezeigt, die beim Umgang mit Daten verwendet werden sollen.
- Im Abschnitt Dokumentverknüpfungen werden die Verknüpfungen angezeigt, die zum Ausführen verschiedener Vorgänge wie Navigation und UI-Skalierung verwendet werden.
- Im Abschnitt Konfiguration werden Details zur Instanz-Konfiguration angezeigt, die während der Installation durchgeführt wurde.
Beschriftungssteuerelemente
Befehl |
Beschreibung |
---|---|
Linksklick | Felder auswählen. Wird sie zusammen mit dem Hotkey des Feldes verwendet, weist sie dem Feld die ausgewählten Informationen zu. |
Rücktaste/Löschen | Entfernt den mit Tags versehenen Wert eines Felds. |
Rechtsklicken | Zeigt den OCR-Text und die aktuelle Beschriftung an. |
Eingabe oder umgekehrter Schrägstrich | Gruppiert oder hebt die Gruppierung von Tabellenzeilen auf, die sich über mehrere Textzeilen erstrecken. |
Dokumentverknüpfungen
Verknüpfung |
Beschreibung |
---|---|
Alt + Pfeil links / Pfeil rechts | Navigiert zwischen Dokumenten. |
Alt + Entf | Löschen oder Wiederherstellen eines Dokuments. |
Strg + Bildlauf | Ändert die Skalierung des Dokuments durch Vergrößern oder Verkleinern. |
- Neues Spaltenfeld erstellen
- Feld bearbeiten
- Spaltenfeldwerte erweitern/reduzieren
Weitere Informationen zu Spaltenfeldern finden Sie in diesem Abschnitt.
- Ein neues reguläres Feld erstellen
- Feld bearbeiten
Weitere Informationen zu regulären Feldern finden Sie in diesem Abschnitt.
- Erstellen Sie ein neues Klassifizierungsfeld.
- Feld bearbeiten
Weitere Informationen zu Klassifizierungsfeldern finden Sie in diesem Abschnitt.
Bei mehrseitigen Dokumenten können Sie natürlich wie bei jedem PDF-Anzeigeprogramm durch die Seiten scrollen. Zum Vergrößern oder Verkleinern halten Sie STRG gedrückt und scrollen mit der Maus.
Sie können Dokumente beschriften, indem Sie die Wortfelder auswählen und sie einem Feld durch Tastendruck zuweisen. Sie können auch mit der rechten Maustaste auf das Wortfeld klicken und die extrahierten Informationen überprüfen.
Weitere Informationen zum Beschriften von Dokumenten finden Sie auf dieser Seite.
Wenn Sie eine neue Document Manager-Sitzung öffnen oder einen leeren Filter haben, werden bestimmte Richtlinien in der Dokumentansicht angezeigt:
Außerdem werden Fehler beim Laden auch in der Dokumentansicht angezeigt:
- Management bar
- Optionen „Löschen“ und „Endgültiges Löschen“
- Suchoption
- Einstellungsmenü
- OCR-Methode
- OCR-URL
- OCR-Schlüssel
- OCR auf PDF-Dateien anwenden
- Vorhersage/Vorbeschriftung
- Vorbeschriftung der URL
- Vorbeschriftung des Schlüssels
- Anleitungen zu …
- Spaltenfelder
- Reguläre Felder
- Klassifizierungsfelder
- Dokumentansicht