- Überblick
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- Überblick
- Document Understanding-Aktivitäten
- Übersicht zur Dokumentklassifizierung
- „Klassifizierer konfigurieren“-Assistent von Classify Document Scope
- Intelligenter Schlüsselwortklassifizierer
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Machine Learning Classifier
- Generativer Klassifizierer
- Dokumentklassifizierung – verwandte Aktivitäten
- Datenverbrauch
- API-Aufrufe
- ML-Pakete
- Überblick
- Document Understanding – ML-Paket
- DocumentClassifier – ML-Paket
- ML-Pakete mit OCR-Funktionen
- 1040 – ML-Paket
- 1040 Anlage C – ML-Paket
- 1040 Anlage D – ML-Paket
- 1040 Anlage E – ML-Paket
- 1040x – ML-Paket
- 3949a – ML-Paket
- 4506T – ML-Paket
- 709 – ML-Paket
- 941x – ML-Paket
- 9465 – ML-Paket
- 990 – ML-Paket – Vorschau
- ACORD125 – ML-Paket
- ACORD126 – ML-Paket
- ACORD131 – ML-Paket
- ACORD140 – ML-Paket
- ACORD25 – ML-Paket
- Bank Statements – ML-Paket
- BillsOfLading – ML-Paket
- Certificate of Incorporation – ML-Paket
- Certificates of Origin – ML-Paket
- Checks – ML-Paket
- Children Product Certificate – ML-Paket
- CMS1500 – ML-Paket
- EU Declaration of Conformity – ML-Paket
- Financial Statements – ML-Paket
- FM1003 – ML-Paket
- I9 – ML-Paket
- ID Cards – ML-Paket
- Invoices – ML-Paket
- InvoicesChina – ML-Paket
- Rechnungen Hebräisch – ML-Paket
- InvoicesIndia – ML-Paket
- InvoicesJapan – ML-Paket
- Invoices Shipping – ML-Paket
- Packing Lists – ML-Paket
- Passports – ML-Paket
- Gehaltsabrechnungen (Pay slips) – ML-Paket
- Purchase Orders – ML-Paket
- Zahlungsbelege – ML-Paket
- RemittanceAdvices – ML-Paket
- UB04 – ML-Paket
- Utility Bills – ML-Paket
- Vehicle Titles – ML-Paket
- W2 – ML-Paket
- W9 – ML-Paket
- Andere out-of-the-box ML-Pakete
- Öffentliche Endpunkte
- Hardwareanforderungen
- Pipelines
- Dokumentmanager
- OCR-Dienste
- Unterstützte Sprachen
- Deep Learning
- Insights-Dashboards
- Document Understanding – in der Automation Suite bereitgestellt
- Document Understanding – im eigenständigen AI Center bereitgestellt
- Lizenzierung
- Aktivitäten
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)

Document Understanding user guide
Beschriften von Dokumenten
Auf der Seite finden Sie die benötigten Dokumentenmengen.
For more details about how to assemble a high-quality dataset, check the Training High Performing Models page.
Felder, die mehrmals im selben Dokument vorkommen
Es gibt viele Situationen, in denen ein Feld an mehreren Stellen im selben Dokument oder sogar auf derselben Seite erscheint. Diese sollten alle beschriftet werden, sofern sie die gleiche Bedeutung haben.
Zum Beispiel der Gesamtbetrag für Betriebskostenabrechnungen. Er steht oft oben, innerhalb einer Liste von Positionen in der Mitte oder in einem Überweisungsschein unten, der abgetrennt werden kann. In dieser Situation würden alle drei Vorkommen beschriftet. Dies ist nützlich, da das Modell in einigen Fällen, wenn ein OCR-Fehler vorliegt oder das Layout unterschiedlich ist und ein Feld nicht identifiziert werden kann, die anderen Vorkommen identifizieren kann.
What counts is the meaning of the value, not the value itself. For instance, on some invoices which carry no tax, the net amount and the total amount have the same value. But they are clearly different concepts. Consequently, they should not be labelled both as total amount but only the one whose meaning is to represent the total amount.
Parallele Beschriftungen durch mehrere Benutzer
Sie können mehrere Benutzer die gleiche Instanz gleichzeitig beschriften lassen, auch für dasselbe Dokument.
Wenn gleichzeitig verschiedene Änderungen am Schema für einen Benutzer vorgenommen werden, werden die Änderungen für die anderen Benutzer nicht durchgeführt, und es erscheint Warnung mit der Meldung, dass die Änderungen nicht durchgeführt werden konnten. Die anderen Benutzer sollten sofort ihren Browser aktualisieren, um die Änderungen zu sehen.
Beschriftungen für Training
When you import a dataset without checking the Make this an Evaluation set checkbox on the Import Data dialog box, then that dataset is used for training and you only need to focus on the labeling of the model and both label and value (selectable words, grey boxes) on the document.
Wenn der Text, der in die Seitenleistenfelder eingegeben wird, ab und zu nicht korrekt ist, ist das kein Problem, da das ML-Modell noch in der Lernphase ist. In einigen Fällen müssen Sie möglicherweise die Konfiguration der Felder anpassen: z. B. durch Aktivieren des Kontrollkästchens Mehrzeilig. Im Allgemeinen liegt jedoch der Schwerpunkt auf der Beschriftung der Wörter auf der Seite.
Beschriftungen für Auswertung
Wenn Sie ein Dataset importieren und das Kontrollkästchen Zu einem Auswertungssatz machen im Dialogfeld „Daten importieren“ aktivieren, wird dieses Dataset von Trainingspipelines im AI Center ignoriert und nur von Auswertungspipelines verwendet.
Es ist wichtig, dass der richtige Text in die Felder in der Seitenleiste (oder in die obere Leiste für Spaltenfelder) eingegeben wird. Dies zu überprüfen, dauert für jedes Feld viel länger, aber nur so erhalten Sie eine zuverlässige Messung der Genauigkeit des ML-Modells, das Sie erstellen.
Der Document Manager unterstützt die Beschriftung von mehrseitigen Dokumenten, daher haben Felder in der Seitenleiste einen einzigen Wert für das gesamte Dokument. Dies spiegelt das Verhalten zur Laufzeit im RPA-Workflow genau wider und ermöglicht es Auswertungspipelines im AI Center, realistische Ergebnisse zu generieren, die die tatsächliche Laufzeitleistung der ML-Modelle widerspiegeln.
Beachten Sie jedoch, dass dies eine größere Änderung gegenüber früheren Releases ist, in denen jede Seite separat beschriftet wurde. Das Beschriften und Exportieren von mehrseitigen Dokumenten geht davon aus, dass jedes Dokument ein einzelnes logisches Dokument darstellt. Beispielsweise kann ein sechsseitiges Dokument eine einzelne sechsseitiges Rechnung enthalten, darf aber keine drei verschiedenen Rechnungen à zwei Seiten enthalten. Dies ist insbesondere für Auswertungssätze wichtig.
Beschriften von Aktionen
Ein bestimmtes Feld kann an mehreren Stellen auf derselben Seite beschriftet werden.
Ein Feld beschriften
To select multiple words, select the first word and then Ctrl/Shift+click the rest of the desired words or select an entire area by dragging the mouse (the rubber banding) over it.
To unselect certain text boxes from your selection, while Ctrl/Shift is pressed, select or rubber band the unwanted text boxes again.
Wenn Ihre Auswahl stimmt, nutzen Sie die Tastenkombination, um das Feld zu beschriften.
Label a multivalued field
Vergewissern Sie sich, dass die Mehrwertoption des Feldes ausgewählt ist.
Wählen Sie den ersten Satz von Informationen aus und tippen Sie auf die Tastenkombination, um das Feld zu beschriften.
Wiederholen Sie die vorherigen Schritte, bis alle Werte für das mehrwertige Feld beschriftet wurden.
A multivalued field displays two values in its collapsed state and all values it its expanded state. Select the expand arrow from the multivalued field to expand and visualize the list of all tagged values.
Eine Beschriftung entfernen
Select text boxes, then press the Delete or the Backspace key on your keyboard.
Eine Tabellenzeile gruppieren
After you have labelled some Column fields, and only if some rows span multiple lines of text, then you may group them together by pressing the / key to indicate that they are part of the same table row. A green box appears around the group.
Wenn ein beschriftetes Spaltenfeld gruppiert wird, wird die Tabelle analysiert und oben angezeigt, wobei die extrahierten Daten hervorgehoben werden.
Die Gruppierung einer Tabellenzeile aufheben
Select the group and press the / key again.
Andere Optionen
Beschriftung auswählen
Verwenden Sie die linke oder rechte Maustaste, um ein Feld auszuwählen oder weitere Informationen darüber zu erhalten.
- Linksklick – Wählt das Feld aus
- Rechtsklick – Wählt das Feld aus und zeigt Informationen über den OCR-Text und die aktuelle Beschriftung an.
Dokumentnavigation
- Alt + Pfeil links/Pfeil rechts – Navigiert zwischen Dokumenten.
Dokumentskalierung
- Ctrl + Bildlauf – Ändert die Skalierung des Dokuments durch Vergrößern oder Verkleinern.
Löschen oder Wiederherstellen eines Dokuments
- Alt + Entf – Löscht ein Dokument.
- Alt + Entf – Stellt ein gelöschtes Dokument wieder her.
- Felder, die mehrmals im selben Dokument vorkommen
- Parallele Beschriftungen durch mehrere Benutzer
- Beschriftungen für Training
- Beschriftungen für Auswertung
- Beschriften von Aktionen
- Ein Feld beschriften
- Label a multivalued field
- Eine Beschriftung entfernen
- Eine Tabellenzeile gruppieren
- Die Gruppierung einer Tabellenzeile aufheben
- Andere Optionen