- Überblick
- Erste Schritte
- Erstellen von Modellen
- Verbrauchen von Modellen
- Modelldetails
- Öffentliche Endpunkte für Automation Cloud und Test Cloud
- Öffentliche Endpunkte für Automation Cloud und Test Cloud – Öffentlicher Sektor
- 1040 – Dokumententyp
- 1040 Formular C – Dokumententyp
- 1040 Formular D – Dokumententyp
- 1040 Formular E – Dokumententyp
- 1040x – Dokumententyp
- 3949a – Dokumententyp
- 4506T – Dokumententyp
- 709 – Dokumententyp
- 941x – Dokumententyp
- 9465 – Dokumententyp
- ACORD125 – Dokumententyp
- ACORD126 – Dokumententyp
- ACORD131 – Dokumententyp
- ACORD140 – Dokumententyp
- ACORD25 – Dokumententyp
- Kontoauszüge – Dokumententyp
- Frachtbrief – Dokumententyp
- Gründungsurkunde – Dokumententyp
- Ursprungszeugnis – Dokumententyp
- Überprüfungen – Dokumententyp
- Children Product Certificate – Dokumententyp
- CMS 1500 – Dokumententyp
- EU-Konformitätserklärung – Dokumententyp
- Finanzberichte – Dokumententyp
- FM1003 – Dokumententyp
- I9 – Dokumententyp
- Ausweise – Dokumententyp
- Rechnungen – Dokumententyp
- Rechnungen2 – Dokumententyp
- Rechnungen Australien – Dokumententyp
- Rechnungen China – Dokumententyp
- Rechnungen Hebräisch – Dokumententyp
- Rechnungen Indien – Dokumententyp
- Rechnungen Japan – Dokumententyp
- Rechnungen Versand – Dokumententyp
- Packlisten – Dokumententyp
- Gehaltsabrechnungen – Dokumententyp
- Reisepässe – Dokumententyp
- Bestellungen – Dokumententyp
- Zahlungsbelege – Dokumententyp
- Belege2 – Dokumententyp
- Zahlungsbelege Japan – Dokumententyp
- Zahlungsavis – Dokumententyp
- UB04 – Dokumententyp
- Angaben zum Abschluss von Hypotheken in den USA – Dokumententyp
- Betriebskostenabrechnungen – Dokumententyp
- Fahrzeugbrief – Dokumententyp
- W2 – Dokumententyp
- W9 – Dokumententyp
- Unterstützte Sprachen
- Insights-Dashboards
- Daten und Sicherheit
- Protokollierung
- Lizenzierung
- Anleitungen zu …
- Fehlersuche und ‑behebung
Document Understanding-Benutzerhandbuch.
Dieser Abschnitt bietet die folgenden Möglichkeiten:
- Laden Sie Dokumente hoch und klassifizieren Sie sie automatisch.
- Laden Sie Dokumente direkt in Dokumenttypen hoch.
- Verwalten Sie Dateien über das Projekt (Dateien hinzufügen, entfernen und Tags hinzufügen, ändern).
- Erstellen Sie Anmerkungen für Dokumente.
- Fügen Sie Felder hinzu oder entfernen Sie sie.
- Have a guided experience on training classification and extraction models using the recommendations. Training is started manually per model: classifiers expose the Start Training button in the Model Training status pill (Helix Classifier on the Split & Classify page; Legacy Classifier in the Recommendations area). Extractors expose the Start Training button on each document type's annotation page, or via the action in its Model Training status pill. For details, see Start a training run.
Annotieren von Dokumenten
Nachdem Sie Ihr Projekt erfolgreich erstellt und Ihre Dokumente in einen bestimmten Dokumenttyp hochgeladen haben, werden sie automatisch vorab kommentiert. Dies geschieht mithilfe einer Kombination aus generativen und spezialisierten Modellen, die auf dem Schema des Dokumenttyps basieren. Das Schema definiert eindeutig die Felder, die Sie aus einem bestimmten Dokumenttyp extrahieren möchten. Um das Schema des Dokumenttyps zu finden, wechseln Sie zur Seite Anmerkung und überprüfen Sie den Abschnitt Felder .
Ausführliche Informationen darüber, wie Sie Anmerkungen zu Ihren Dokumenten hinzufügen können, finden Sie auf der Seite Hinzufügen von Anmerkungen zu Dokumenten.
Ausnahmen für die Überprüfung
Sie können Dokumente verwenden, die in der Validation Station validiert wurden, um die Leistung Ihrer Modelle weiter zu verbessern.
Wenn nach dem Validierungsschritt Änderungen vorgenommen werden, wird die Taste Ausnahmen zur Überprüfung für den betroffenen Dokumententyp angezeigt.
Abbildung 1. Taste „Ausnahmen bei der Überprüfung“
Weitere Informationen dazu, wie Sie Ihre Modelle neu trainieren können, finden Sie auf der Seite mit Anweisungen zum erneuten Trainieren von Extraktoren.
Dokumente mit Tags versehen
Sobald Sie Ihre Dokumente hochgeladen haben, können Sie ihnen Tags hinzufügen.
Sie können für jedes Dokument ein Tag mit maximal 100 Zeichen hinzufügen.
Um Ihren Dokumenten ein Tag hinzuzufügen, wählen Sie die gewünschten Dokumente und wählen Sie die Schaltfläche Tags aus dem Menü über der Liste der Dokumenttypen.
Sie können Ihre Dokumente leichter durchsuchen, wenn Sie nach Tags filtern. Sie können auch die Ergebnisse pro Tag in der erweiterten Konfigurationsdatei überprüfen, wenn ein Modell trainiert wird.
Dokumententypmanager
Sie können die Einstellungen für mehrere Felder über den Dokumenttypmanager bearbeiten.
Um dorthin zu gelangen, wählen Sie das Drei-Punkte-Symbol ⋮ neben dem Dokumenttyp aus, den Sie bearbeiten möchten, und wählen Sie im Menü Dokumenttypmanager aus.
Abbildung 2. Dokumenttypmanager auswählen
Empfehlungen in Document Understanding werden nur angezeigt, wenn der Benutzer über ausreichende Berechtigungen verfügt, um die durch die Empfehlung vorgeschlagene Aktion auszuführen. Wenn Sie keine Berechtigungen zum Ausführen der empfohlenen Aktionen haben, wird eine Meldung angezeigt, die auf unzureichenden Zugriff hinweist. Benutzer mit den Rollen Document Understanding Developer, Document Understanding Administrator und Document Understanding Projektadministrator können alle verfügbaren Empfehlungen anzeigen. Die Rolle „Projektadministrator“ wendet diese Berechtigungen nur auf der Projektebene an.
Extraktionsfelder
Bearbeiten oder Hinzufügen neuer Felder
Um ein neues Feld hinzuzufügen, wählen Sie Feld hinzufügen aus und geben Sie die erforderlichen Informationen ein. Sie können die folgenden Optionen für jedes Feld hinzufügen oder bearbeiten:
-
Feldname: Der eindeutige Name für das Feld.
-
Inhaltstyp: Der Inhaltstyp des Felds:
- String: Für Firmennamen oder Adressen sowie Zahlungsbedingungen oder für jedes andere Feld, für das Sie die Analyse- oder Formatierungslogik manuell im RPA-Workflow erstellen möchten.
- Zahl: Für Beträge oder Mengen, mit intelligenter Analyse der Dezimal-/Tausendertrennzeichen.
- Datum: Analysieren, formatieren und vereinheitlichen Sie die Ausgabe im Format JJJJ-MM-TT.
- Telefon: Für Telefonnummern. Bei der Formatierung werden Buchstaben und Klammern entfernt. Leerzeichen werden durch Bindestriche ersetzt.
- ID-Nummer: Für alphanumerische Codes, Nummern von IDs. Diese Option ähnelt dem String-Inhaltstyp, entfernt jedoch alle Zeichen, die vor dem Zeichen
:stehen. Wenn die ID-Nummer, die Sie extrahieren müssen, das Zeichen:enthalten kann, verwenden Sie stattdessen den Inhaltstypstringum Datenverlust zu vermeiden.
-
Tastenkombination: Die Tastenkombination für das Feld. Ein Schlüssel oder eine Kombination von zwei Schlüsseln ist zulässig.
-
Erweiterte Einstellungen: Die verfügbaren Optionen unterscheiden sich je nach Inhaltstyp des ausgewählten Felds. Wählen Sie die Taste Erweiterte Einstellungen für das gewünschte Feld, das bearbeitet werden soll: Abbildung 3. Erweiterte Einstellungen für den Dokumenttyp
- Feld-ID: Die eindeutige ID für das Feld.
- Nachverarbeiten:
- first_span: Wenn das Modell mehr als eine Instanz eines Felds in einem Dokument vorhersagt, soll das Modell die erste Instanz zurückgeben.
- longest_value: Wenn das Modell mehr als eine Instanz eines Felds in einem Dokument vorhersagt, soll das Modell den Wert mit der höchsten Anzahl an Zeichen zurückgeben.
- highest_confidence: Wenn das Modell mehr als eine Instanz eines Felds in einem Dokument vorhersagt, soll das Modell den Wert mit der höchsten Konfidenz zurückgeben.Bewertung: Das Maß zur Bestimmung der Genauigkeit beim Auswerten von Modellvorhersagen ist nur für Felder mit Inhaltstyp String verfügbar:
- exact_match: Eine Vorhersage gilt nur dann als richtig (Punktzahl 1), wenn sie exakt dem wahren Wert entspricht. Unterscheidet sie sich auch nur um ein einziges Zeichen, so gilt sie als falsch (Punktzahl 0). Dies ist die Standardeinstellung für alle Felder mit Ausnahme der String-Felder.
- levenshtein: Eine Vorhersage wird gemäß der Levenshtein-Distanz zwischen der Vorhersage und dem true-Wert als teilweise richtig erachtet. Beispiel: Wenn ein 10-Buchstaben-Wert bis auf die letzten zwei Zeichen korrekt vorhergesagt wird, dann beträgt die Punktzahl dieser Vorhersage 0,8.
- Datumsformat: Dieses Feld ist nur für Felder mit dem Inhaltstyp Datum verfügbar und gibt an, wie mehrdeutige Datumsangaben analysiert und zurückgegeben werden:
- Auto
- US-Stil: JJJJ-TT-MM
- Nicht-US-Stil: JJJJ-MM-TT
- Mehrzeilig: Bei Feldern, die sich über mehrere Textzeilen erstrecken (Adressen oder Beschreibungen), muss diese Option aktiviert sein, sonst wird nur die erste Zeile zurückgegeben.
- Mehrfachwert: Das Feld gibt eine Liste mit allen im Dokument erkannten Werten zurück.
Sie können die Felder aus dieser Ansicht auch neu anordnen.
Changes in document type settings do not trigger training automatically. A warning is shown when a schema change has not yet been included in a trained model. To include the change, select Start Training on the document type's annotation page before you create a new project version.
Suchfeldnamen
Sie können die verfügbaren Feldnamen durchsuchen. Verwenden Sie dazu die Suchleiste in der oberen linken Ecke der Dokumenttypmanager-Schnittstelle. Zur effizienteren Suche können Sie die Funktion Filter verwenden, um nach Inhaltstyp zu filtern.
Abbildung 4. Namen der Suchfelder
Felder löschen
Wählen Sie die Taste Löschen neben dem Feld, das Sie löschen möchten.
Abbildung 5. Ein Feld löschen
Sie können auch mehrere (oder alle) Felder auswählen und sie gleichzeitig löschen. Aktivieren Sie dazu das Häkchen neben den Feldern, die Sie löschen möchten, und wählen Sie dann Löschen aus.
Abbildung 6. Löschen Sie mehrere Felder auf einmal.
Klassifizierungsfelder
Klassifizierungsfelder sind Datenpunkte, die sich auf ein Dokument als Ganzes beziehen. Zum Beispiel sind der Spesentyp einer Quittung (Essen, Hotel, Flüge oder Transport) oder die Währung einer Rechnung (USD, EUR, JPY) Klassifizierungsfelder.
Folgende Einschränkungen gelten derzeit für die Funktion „Klassifizierungsfelder“:
- Bei Verwendung der Aktivität „Extract Document Data“ werden Klassifizierungsfelder für moderne Projektextraktoren und Out-of-the-Box-Modelle unterstützt, nicht jedoch für klassische Projektextraktoren.
- Klassifizierungsfelder werden für benutzerdefinierte Dokumententypen erst nach einem erfolgreichen Training extrahiert.
Bearbeiten oder hinzufügen von Klassifizierungsfeldern
Um ein neues Klassifizierungsfeld hinzuzufügen, wählen Sie Feld hinzufügen und geben Sie einen Namen für das neue Feld ein.
Sie können die Felder aus dieser Ansicht auch neu anordnen.
Abbildung 7. Ein neues Klassifizierungsfeld hinzufügen
Um die ID des Klassifizierungsfelds zu überprüfen, wählen Sie Erweiterte Einstellungen neben dem gewünschten Klassifizierungsfeld.
Abbildung 8: Erweiterte Einstellungen für Klassifizierungsfelder
Bearbeiten oder Hinzufügen von Klassen
Um eine neue Klasse für ein Klassifizierungsfeld hinzuzufügen, wählen Sie Klasse hinzufügen und geben Sie einen Klassennamen sowie eine optionale Beschreibung ein.
Jedes Klassifizierungsfeld muss mindestens zwei Klassen enthalten.
Abbildung 9. Neue Klasse hinzufügen
Sie können den Namen und die Beschreibung für jede Klasse bearbeiten.
Sie können die Klassen auch in dieser Ansicht neu anordnen.
Um eine Klasse zu entfernen, wählen Sie Löschen neben der Klasse, die Sie entfernen möchten.
Abbildung 10. Eine Klasse löschen
Einstellungen
Sie können die Einstellungen des Dokumententyps über die Registerkarte Einstellungen ändern.
Abbildung 11. Einstellungen für das Modell
Sie können die folgenden Einstellungen ändern:
- Basismodell: Die Schätzungen der Dataset-Größe, die in den empfohlenen Aktionen verwendet werden, hängen von dem für das Training verwendeten Basismodell ab. Wenn Sie das Basismodell verwenden, das Ihrem Dokumenttyp am ähnlichsten ist, verringert sich der Arbeitsaufwand für die Beschriftung.
- Anzahl der Sprachen: Die Schätzung der Dataset-Größe, die in den empfohlenen Aktionen verwendet wird, hängt von der Anzahl der Sprachen im Dataset ab. Je mehr Sprachen, desto mehr Daten müssen annotiert werden.
Dokumente durchsuchen
Sie können hochgeladene Dokumente anhand des Dokumentnamens suchen. Verwenden Sie dazu die Suchleiste in der oberen linken Ecke des Abschnitts Erstellen. Für eine effizientere Suche verwenden Sie die Filterfunktion zum Filtern nach:
- Dokumenttyp: Wählen Sie den gewünschten Dokumenttyp aus der Dropdownliste aus.
- Upload-Datum: Wählen Sie ein Datumsintervall aus, in dem das Dokument hochgeladen wurde.
- Status: Wählen Sie den Status des Dokuments aus.
- Tag: Wählen Sie die Tags aus, nach denen Sie filtern möchten.
Abbildung 12. Dokumente filtern
Projekt- und Modellpunktzahl
Sie können die Gesamtpunktzahl Ihres Projekts in der oberen rechten Ecke überprüfen. Diese Punktzahl beeinflusst die Klassifizierer- und Extraktorpunktzahlen für alle Dokumenttypen. Wählen Sie Projektpunktzahl aus, um den Abschnitt Messen anzuzeigen. Detailliertere Leistungsmessungen finden Sie in diesem Abschnitt.
Sie können die Punktzahl für jeden Dokumenttyp separat im Abschnitt „Dokumenttyp“ überprüfen. Diese Punktzahl berücksichtigt die Gesamtleistung des Modells sowie die Größe und Qualität des Datasets.
Sie müssen mindestens 10 Dokumente hochladen, um eine Projektpunktzahl zu erhalten. Für eine Dokumenttyppunktzahl benötigen Sie mindestens 10 Dokumente unter demselben Dokumenttyp.
Sie können die Modellbewertung Ihrer Modelle überprüfen, wenn Sie das Punktzahl-Tag auswählen. Die Modellbewertung ist eine Funktion, mit der Sie die Leistung eines Klassifizierungsmodells visualisieren können. Sie wird als Modellpunktzahl von 0 bis 100 mit der folgenden Bedeutung ausgedrückt:
- Schlecht (0–49)
- Durchschnitt (50–69)
- Gut (70–89)
- Ausgezeichnet (90–100)
Wählen Sie Detaillierte Modellbewertungen aus, um zum Abschnitt Messung für detaillierte Informationen zu wechseln.