- Überblick
- Erste Schritte
- Erstellen von Modellen
- Verbrauchen von Modellen
- Modelldetails
- Öffentliche Endpunkte
- 1040 – Dokumententyp
- 1040 Formular C – Dokumententyp
- 1040 Formular D – Dokumententyp
- 1040 Formular E – Dokumententyp
- 1040x – Dokumententyp
- 3949a – Dokumententyp
- 4506T – Dokumententyp
- 709 – Dokumententyp
- 941x – Dokumententyp
- 9465 – Dokumententyp
- ACORD125 – Dokumententyp
- ACORD126 – Dokumententyp
- ACORD131 – Dokumententyp
- ACORD140 – Dokumententyp
- ACORD25 – Dokumententyp
- Kontoauszüge – Dokumententyp
- Frachtbrief – Dokumententyp
- Gründungsurkunde – Dokumententyp
- Ursprungszeugnis – Dokumententyp
- Überprüfungen – Dokumententyp
- Children Product Certificate – Dokumententyp
- CMS 1500 – Dokumententyp
- EU-Konformitätserklärung – Dokumententyp
- Finanzberichte – Dokumententyp
- FM1003 – Dokumententyp
- I9 – Dokumententyp
- Ausweise – Dokumententyp
- Rechnungen – Dokumententyp
- Rechnungen2 – Dokumententyp
- Rechnungen Australien – Dokumententyp
- Rechnungen China – Dokumententyp
- Rechnungen Hebräisch – Dokumententyp
- Rechnungen Indien – Dokumententyp
- Rechnungen Japan – Dokumententyp
- Rechnungen Versand – Dokumententyp
- Packlisten – Dokumententyp
- Gehaltsabrechnungen – Dokumententyp
- Reisepässe – Dokumententyp
- Bestellungen – Dokumententyp
- Zahlungsbelege – Dokumententyp
- Belege2 – Dokumententyp
- Zahlungsbelege Japan – Dokumententyp
- Zahlungsavis – Dokumententyp
- UB04 – Dokumententyp
- Angaben zum Abschluss von Hypotheken in den USA – Dokumententyp
- Betriebskostenabrechnungen – Dokumententyp
- Fahrzeugbrief – Dokumententyp
- W2 – Dokumententyp
- W9 – Dokumententyp
- Unterstützte Sprachen
- Insights-Dashboards
- Document Understanding – in der Automation Suite bereitgestellt
- Protokollierung
- Lizenzierungs- und Gebührenlogik
- Anleitungen zu …
- Fehlersuche und ‑behebung
Moderne Document Understanding-Projekte – Benutzerhandbuch
Ein Dokumenttyp ist die Definition eines logischen Dokuments, der von verschiedenen Geschäftsprozessen verarbeitet werden muss.
Was ist ein Dokumenttyp und was kann er enthalten?
Zu den Dokumenttypen gehören Rechnungen, Gesundheitsakten, Steuerbescheide, Verträge und andere. Ein Dokumenttyp enthält in der Regel neben einem Namen, einer Gruppe und einer Kategorie eine Sammlung von Feldern.
Beispielsweise enthalten Rechnungen in der Regel die folgenden Informationen:
- Anbietername, Anbieteradresse, Rechnungsname, Rechnungsadresse
- Rechnungsnummer, Bestellnummer, Zahlungsbedingungen, Fälligkeitsdatum
- Nettobetrag, Steuerbetrag, Rabatt, Gesamtbetrag
- Umsatzsteuer-Identifikationsnummer, Umsatzsteuersatz
- Bankkontonummer, Bankname, SWIFT, IBAN
Abbildung 1. Rechnungsbeispiel

Dokumenttypformate
Dokumenttypen können basierend auf ihrem Format klassifiziert werden. Einige Dokumenttypen haben einen sehr strukturierten Inhalt, während andere hauptsächlich aus freiem Text bestehen.
Dokumente werden in drei Hauptformate klassifiziert:
- Structured
- Halbstrukturiert
- Unstrukturiert
Dokumente können oft eine Kombination dieser drei Kategorien sein. Eine Datei kann eine strukturierte Überschrift gefolgt von einem unstrukturierten Freiforminhalt haben. Sie können auch unstrukturierte Inhalte mit bestimmten Informationen enthalten, die immer in einem sehr strukturierten oder sich wiederholenden Kontext erscheinen.
Strukturierte Dokumente
Beispiele für strukturierte Dokumente:
- Umfragen
- Fragebögen
- Steuerformulare
- Passports
- Lizenzen
- Stundentabellen
Diese Dokumente sind dazu konzipiert, Informationen in einem bestimmten Format zu sammeln. Sie enthalten in der Regel Schlüssel-Wert-Paare, Tabellen, handschriftlichen Text, Signaturen und Kontrollkästchen. Diese Dokumente leiten den Benutzer, indem sie genaue Bereiche für die Eingabe der einzelnen Daten vorsehen. Solche Dokumente werden allgemein als Formulare bezeichnet und verwendet, um Daten mit geringer Vielfalt zu erfassen.
Abbildung 2. Führerschein, ein Beispiel für ein strukturiertes Dokument

Halbstrukturierte Dokumente
Halbstrukturierte Dokumente sind Dokumente, die keinem strikten Format wie strukturierten Formularen folgen und nicht an bestimmte Datenfelder gebunden sind. Diese haben keine feste Form, sondern folgen einem ausreichend gängigen Format. Sie enthalten feste und variable Teile, wie Tabellen. Sie können auch Absätze enthalten, aber Daten liegen hauptsächlich in Schlüssel-Wert-Paaren vor. Halbstrukturierte Dokumente beinhalten:
- Rechnungen
- Belege
- Bestellungen
- Medizinische Laborberichte
- Bank Statements
- Betriebskostenabrechnungen
Abbildung 3. Rechnung, ein Beispiel für ein halbstrukturiertes Dokument

Unstrukturierte Dokumente
Unstrukturierte Dokumente sind Dateien, die keinem bestimmten oder organisierten Modell folgen. Sie haben kein festes Format und die enthaltenen Informationen werden oft unstrukturiert dargestellt, was die Verarbeitung durch Roboter erschwert. Während Menschen diese Dokumente leicht verstehen können, können die Daten für Maschinen schwierig zu interpretieren sein. Unstrukturierte Dokumente können viele Formen annehmen, einschließlich:
- Verträge
- Mietverträge
- Geschäftsberichte
- Vereinbarungen
- Nachrichtenartikel
Abbildung 4. Lizenzvereinbarung, ein Beispiel für ein unstrukturiertes Dokument
