- Überblick
- Erste Schritte
- Erstellen von Modellen
- Verbrauchen von Modellen
- Modelldetails
- Öffentliche Endpunkte
- 1040 – Dokumententyp
- 1040 Formular C – Dokumententyp
- 1040 Formular D – Dokumententyp
- 1040 Formular E – Dokumententyp
- 1040x – Dokumententyp
- 3949a – Dokumententyp
- 4506T – Dokumententyp
- 709 – Dokumententyp
- 941x – Dokumententyp
- 9465 – Dokumententyp
- ACORD125 – Dokumententyp
- ACORD126 – Dokumententyp
- ACORD131 – Dokumententyp
- ACORD140 – Dokumententyp
- ACORD25 – Dokumententyp
- Kontoauszüge – Dokumententyp
- Frachtbrief – Dokumententyp
- Gründungsurkunde – Dokumententyp
- Ursprungszeugnis – Dokumententyp
- Überprüfungen – Dokumententyp
- Children Product Certificate – Dokumententyp
- CMS 1500 – Dokumententyp
- EU-Konformitätserklärung – Dokumententyp
- Finanzberichte – Dokumententyp
- FM1003 – Dokumententyp
- I9 – Dokumententyp
- Ausweise – Dokumententyp
- Rechnungen – Dokumententyp
- Rechnungen2 – Dokumenttyp
- Rechnungen Australien – Dokumententyp
- Rechnungen China – Dokumententyp
- Rechnungen Hebräisch – Dokumententyp
- Rechnungen Indien – Dokumententyp
- Rechnungen Japan – Dokumententyp
- Rechnungen Versand – Dokumententyp
- Packlisten – Dokumententyp
- Gehaltsabrechnungen – Dokumententyp
- Reisepässe – Dokumententyp
- Bestellungen – Dokumententyp
- Zahlungsbelege – Dokumententyp
- Belege2 – Dokumenttyp
- Zahlungsbelege Japan – Dokumententyp
- Zahlungsavis – Dokumententyp
- UB04 – Dokumententyp
- US-H Optionalklick – Dokumenttyp
- Betriebskostenabrechnungen – Dokumententyp
- Fahrzeugbrief – Dokumententyp
- W2 – Dokumententyp
- W9 – Dokumententyp
- Unterstützte Sprachen
- Daten und Sicherheit
- Lizenzierungs- und Gebührenlogik
- Anleitungen zu …
- Fehlersuche und ‑behebung

Document Understanding-Benutzerhandbuch für Automation Cloud Dedicated
- Laden Sie Dokumente hoch und klassifizieren Sie sie automatisch.
- Laden Sie Dokumente direkt in Dokumenttypen hoch.
- Verwalten Sie Dateien über das Projekt (Dateien hinzufügen, entfernen und Tags hinzufügen, ändern).
- Erstellen Sie Anmerkungen für Dokumente.
- Fügen Sie Felder hinzu oder entfernen Sie sie.
- Sie erhalten eine Anleitung zum Training von Klassifizierungs- und Extraktionsmodellen anhand der Empfehlungen.
Nachdem Sie Ihr Projekt erfolgreich erstellt und Ihre Dokumente in einen bestimmten Dokumenttyp hochgeladen haben, werden sie automatisch vorab kommentiert. Dies geschieht mithilfe einer Kombination aus generativen und spezialisierten Modellen, die auf dem Schema des Dokumenttyps basieren. Das Schema definiert eindeutig die Felder, die Sie aus einem bestimmten Dokumenttyp extrahieren möchten. Um das Schema des Dokumenttyps zu finden, wechseln Sie zur Seite Anmerkung und überprüfen Sie den Abschnitt Felder.
Ausführliche Informationen darüber, wie Sie Anmerkungen zu Ihren Dokumenten hinzufügen können, finden Sie auf der Seite Hinzufügen von Anmerkungen zu Dokumenten.
Sie können Dokumente verwenden, die in der Validation Station validiert wurden, um die Leistung Ihrer Modelle weiter zu verbessern.
Wenn nach dem Validierungsschritt Änderungen vorgenommen werden, wird die Taste Ausnahmen zur Überprüfung für den betroffenen Dokumententyp angezeigt.
Weitere Informationen dazu, wie Sie Ihre Modelle neu trainieren können, finden Sie auf der Seite mit Anweisungen zum erneuten Trainieren von Extraktoren.
Sobald Sie Ihre Dokumente hochgeladen haben, können Sie ihnen Tags hinzufügen.
Sie können für jedes Dokument ein Tag mit maximal 100 Zeichen hinzufügen.
Um Ihren Dokumenten ein Tag hinzuzufügen, wählen Sie die gewünschten Dokumente und wählen Sie die Schaltfläche Tags aus dem Menü über der Liste der Dokumenttypen.
Sie können Ihre Dokumente leichter durchsuchen, wenn Sie nach Tags filtern. Sie können auch die Ergebnisse pro Tag in der erweiterten Konfigurationsdatei überprüfen, wenn ein Modell trainiert wird.
Sie können die Einstellungen für mehrere Felder im Dokumenttypmanager bearbeiten.
Um dorthin zu gelangen, wählen Sie das Drei-Punkte-Symbol ⋮ neben dem Dokumenttyp aus, den Sie bearbeiten möchten, und wählen Sie Dokumenttypmanager im Menü aus.
Bearbeiten oder Hinzufügen neuer Felder
- Feldname: Der eindeutige Name für das Feld.
- Inhaltstyp: Der Inhaltstyp des Felds:
- String: Für Firmennamen oder Adressen sowie Zahlungsbedingungen oder für jedes andere Feld, für das Sie die Analyse- oder Formatierungslogik manuell im RPA-Workflow erstellen möchten.
- Zahl: Für Beträge oder Mengen, mit intelligenter Analyse der Dezimal-/Tausendertrennzeichen.
- Datum: Analysieren, formatieren und vereinheitlichen Sie die Ausgabe im Format JJJJ-MM-TT.
- Telefon: Für Telefonnummern. Bei der Formatierung werden Buchstaben und Klammern entfernt. Leerzeichen werden durch Bindestriche ersetzt.
- ID-Nummer: Für alphanumerische Codes, Nummern von IDs. Diese Option ähnelt dem String-Inhaltstyp, entfernt jedoch alle Zeichen, die vor dem Zeichen
:
stehen. Wenn die ID-Nummer, die Sie extrahieren müssen, das Zeichen:
enthalten kann, verwenden Sie stattdessen den Inhaltstypstring
, um Datenverlust zu vermeiden.
- Tastenkombination: Die Tastenkombination für das Feld. Ein Schlüssel oder eine Kombination aus zwei Schlüsseln ist zulässig.
- Erweiterte Einstellungen: Die verfügbaren Optionen unterscheiden sich je nach Inhaltstyp des ausgewählten Felds. Wählen Sie die Schaltfläche Erweiterte Einstellungen für das gewünschte Feld aus, das bearbeitet werden soll:
Abbildung 3. Erweiterte Einstellungen für den Dokumenttyp
- Feld-ID: Die eindeutige ID für das Feld.
- Nachverarbeiten:
- first_span: Wenn das Modell mehr als eine Instanz eines Felds in einem Dokument vorhersagt, soll das Modell die erste Instanz zurückgeben.
- longest_value: Wenn das Modell mehr als eine Instanz eines Felds in einem Dokument vorhersagt, soll das Modell den Wert mit der höchsten Anzahl an Zeichen zurückgeben.
- highest_confidence: Wenn das Modell mehr als eine Instanz eines Felds in einem Dokument vorhersagt, soll das Modell den Wert mit der höchsten Konfidenz zurückgeben.
- exact_match: Eine Vorhersage gilt nur dann als richtig (Punktzahl 1), wenn sie exakt dem wahren Wert entspricht. Unterscheidet sie sich auch nur um ein einziges Zeichen, so gilt sie als falsch (Punktzahl 0). Dies ist die Standardeinstellung für alle Felder mit Ausnahme der String-Felder.
- levenshtein: Eine Vorhersage wird gemäß der Levenshtein-Distanz zwischen der Vorhersage und dem true-Wert als teilweise richtig erachtet. Beispiel: Wenn ein 10-Buchstaben-Wert bis auf die letzten zwei Zeichen korrekt vorhergesagt wird, dann beträgt die Punktzahl dieser Vorhersage 0,8.
- Datumsformat: Dieses Feld ist nur für Felder mit dem Inhaltstyp Datum verfügbar und gibt an, wie mehrdeutige Datumsangaben geparst und zurückgegeben werden:
- Auto
- US-Stil: JJJJ-TT-MM
- Nicht US-amerikanischer Stil: JJJJ-MM-TT
- Mehrzeilig: Bei Feldern, die sich über mehrere Textzeilen erstrecken (Adressen oder Beschreibungen), muss diese Option aktiviert sein, sonst wird nur die erste Zeile zurückgegeben.
- Mehrfachwert: Das Feld gibt eine Liste mit allen im Dokument erkannten Werten zurück.
Änderungen an Dokumenttypeinstellungen werden in der neuen Projektversion nicht widergespiegelt, wenn Sie eine neue Projektversion veröffentlichen, bevor Sie ein Training erneut auslösen.
Problemumgehung: Um dies zu vermeiden, trainieren Sie den Dokumenttyp neu, nachdem Sie Änderungen an den Dokumenttypfeldern vorgenommen haben. Sie können dies tun, indem Sie zusätzliche Dokumente für diesen Typ mit Tags versehen oder bestätigen, bevor Sie eine neue Version veröffentlichen.
Modelleinstellungen
Sie können die Dokumenttypeinstellungen in der Ansicht „ Modelleinstellungen “ ändern. Wählen Sie dazu Modelleinstellungen aus.
Sie können die folgenden Einstellungen ändern:
- Basismodell: Die Schätzungen der Dataset-Größe, die in den empfohlenen Aktionen verwendet werden, hängen von dem für das Training verwendeten Basismodell ab. Wenn Sie das Basismodell verwenden, das Ihrem Dokumenttyp am ähnlichsten ist, verringert sich der Arbeitsaufwand für die Beschriftung.
- Anzahl der Sprachen: Die Schätzung der Dataset-Größe, die in den empfohlenen Aktionen verwendet wird, hängt von der Anzahl der Sprachen im Dataset ab. Je mehr Sprachen, desto mehr Daten müssen annotiert werden.
Suchfeldnamen
Sie können die verfügbaren Feldnamen durchsuchen. Verwenden Sie dazu die Suchleiste in der oberen linken Ecke der Dokumenttypmanager-Schnittstelle. Zur effizienteren Suche können Sie die Funktion Filter verwenden, um nach Inhaltstyp zu filtern.
Felder löschen
Wählen Sie die Option Löschen neben dem Feld aus, das Sie löschen möchten.
Klassifizierungsfelder
Klassifizierungsfelder sind Datenpunkte, die sich auf ein Dokument als Ganzes beziehen. Zum Beispiel sind der Spesentyp einer Quittung (Essen, Hotel, Flüge oder Transport) oder die Währung einer Rechnung (USD, EUR, JPY) Klassifizierungsfelder.
- Bei Verwendung der Aktivität „Extract Document Data“ werden Klassifizierungsfelder für moderne Projektextraktoren und Out-of-the-Box-Modelle unterstützt, nicht jedoch für klassische Projektextraktoren.
- Klassifizierungsfelder werden für benutzerdefinierte Dokumententypen erst nach einem erfolgreichen Training extrahiert.
Bearbeiten oder hinzufügen von Klassifizierungsfeldern
Um ein neues Klassifizierungsfeld hinzuzufügen, wählen Sie Feld hinzufügen und geben Sie einen Namen für das neue Feld ein.
Sie können die Felder aus dieser Ansicht auch neu anordnen.
Um die ID des Klassifizierungsfelds zu überprüfen, wählen Sie Erweiterte Einstellungen neben dem gewünschten Klassifizierungsfeld.
Bearbeiten oder Hinzufügen von Klassen
Um eine neue Klasse für ein Klassifizierungsfeld hinzuzufügen, wählen Sie Klasse hinzufügen und geben Sie einen Klassennamen sowie eine optionale Beschreibung ein.
Sie können den Namen und die Beschreibung für jede Klasse bearbeiten.
Sie können die Klassen auch in dieser Ansicht neu anordnen.
Um eine Klasse zu entfernen, wählen Sie Löschen neben der Klasse, die Sie entfernen möchten.
- Dokumenttyp: Wählen Sie den gewünschten Dokumenttyp aus der Dropdownliste aus.
- Upload-Datum: Wählen Sie ein Datumsintervall aus, in dem das Dokument hochgeladen wurde.
- Status: Wählen Sie den Status des Dokuments aus.
Sie können die Gesamtpunktzahl Ihres Projekts in der oberen rechten Ecke überprüfen. Diese Punktzahl beeinflusst die Klassifizierer- und Extraktorpunktzahlen für alle Dokumenttypen. Wählen Sie Projektpunktzahl aus, um den Abschnitt Messen anzuzeigen. Detailliertere Leistungsmessungen finden Sie in diesem Abschnitt.
Sie können die Punktzahl für jeden Dokumenttyp separat im Abschnitt „Dokumenttyp“ überprüfen. Diese Punktzahl berücksichtigt die Gesamtleistung des Modells sowie die Größe und Qualität des Datasets.
- Schlecht (0–49)
- Durchschnitt (50–69)
- Gut (70–89)
- Ausgezeichnet (90–100)
Wählen Sie Detaillierte Modellbewertungen aus, um zum Abschnitt Messung für detaillierte Informationen zu wechseln.