- Überblick
- Erste Schritte
- Erstellen von Modellen
- Verbrauchen von Modellen
- Modelldetails
- Öffentliche Endpunkte
- 1040 – Dokumententyp
- 1040 Formular C – Dokumententyp
- 1040 Formular D – Dokumententyp
- 1040 Formular E – Dokumententyp
- 1040x – Dokumententyp
- 3949a – Dokumententyp
- 4506T – Dokumententyp
- 709 – Dokumententyp
- 941x – Dokumententyp
- 9465 – Dokumententyp
- ACORD125 – Dokumententyp
- ACORD126 – Dokumententyp
- ACORD131 – Dokumententyp
- ACORD140 – Dokumententyp
- ACORD25 – Dokumententyp
- Kontoauszüge – Dokumententyp
- Frachtbrief – Dokumententyp
- Gründungsurkunde – Dokumententyp
- Ursprungszeugnis – Dokumententyp
- Überprüfungen – Dokumententyp
- Children Product Certificate – Dokumententyp
- CMS 1500 – Dokumententyp
- EU-Konformitätserklärung – Dokumententyp
- Finanzberichte – Dokumententyp
- FM1003 – Dokumententyp
- I9 – Dokumententyp
- Ausweise – Dokumententyp
- Rechnungen – Dokumententyp
- Rechnungen2 – Dokumententyp
- Rechnungen Australien – Dokumententyp
- Rechnungen China – Dokumententyp
- Rechnungen Hebräisch – Dokumententyp
- Rechnungen Indien – Dokumententyp
- Rechnungen Japan – Dokumententyp
- Rechnungen Versand – Dokumententyp
- Packlisten – Dokumententyp
- Gehaltsabrechnungen – Dokumententyp
- Reisepässe – Dokumententyp
- Bestellungen – Dokumententyp
- Zahlungsbelege – Dokumententyp
- Belege2 – Dokumententyp
- Zahlungsbelege Japan – Dokumententyp
- Zahlungsavis – Dokumententyp
- UB04 – Dokumententyp
- Angaben zum Abschluss von Hypotheken in den USA – Dokumententyp
- Betriebskostenabrechnungen – Dokumententyp
- Fahrzeugbrief – Dokumententyp
- W2 – Dokumententyp
- W9 – Dokumententyp
- Unterstützte Sprachen
- Insights-Dashboards
- Document Understanding – in der Automation Suite bereitgestellt
- Protokollierung
- Lizenzierungs- und Gebührenlogik
- Anleitungen zu …
- Fehlersuche und ‑behebung

Document Understanding modern projects user guide
Dokumenttypen
Ein Dokumenttyp ist die Definition eines logischen Dokuments, der von verschiedenen Geschäftsprozessen verarbeitet werden muss.
Was ist ein Dokumenttyp und was kann er enthalten?
Zu den Dokumenttypen gehören Rechnungen, Gesundheitsakten, Steuerbescheide, Verträge und andere. Ein Dokumenttyp enthält in der Regel neben einem Namen, einer Gruppe und einer Kategorie eine Sammlung von Feldern.
Beispielsweise enthalten Rechnungen in der Regel die folgenden Informationen:
- Anbietername, Anbieteradresse, Rechnungsname, Rechnungsadresse
- Rechnungsnummer, Bestellnummer, Zahlungsbedingungen, Fälligkeitsdatum
- Nettobetrag, Steuerbetrag, Rabatt, Gesamtbetrag
- Umsatzsteuer-Identifikationsnummer, Umsatzsteuersatz
- Bankkontonummer, Bankname, SWIFT, IBAN
Figure 1. Invoice example

Dokumenttypformate
Dokumenttypen können basierend auf ihrem Format klassifiziert werden. Einige Dokumenttypen haben einen sehr strukturierten Inhalt, während andere hauptsächlich aus freiem Text bestehen.
Dokumente werden in drei Hauptformate klassifiziert:
- Structured
- Halbstrukturiert
- Unstrukturiert
Documents can often be a combination of these three categories. A file can have a structured heading, followed by an unstructured, free-form content. They can also contain unstructured content with specific information that always appears in a very structured or repeating context.
Strukturierte Dokumente
Beispiele für strukturierte Dokumente:
- Umfragen
- Fragebögen
- Steuerformulare
- Passports
- Lizenzen
- Stundentabellen
Diese Dokumente sind dazu konzipiert, Informationen in einem bestimmten Format zu sammeln. Sie enthalten in der Regel Schlüssel-Wert-Paare, Tabellen, handschriftlichen Text, Signaturen und Kontrollkästchen. Diese Dokumente leiten den Benutzer, indem sie genaue Bereiche für die Eingabe der einzelnen Daten vorsehen. Solche Dokumente werden allgemein als Formulare bezeichnet und verwendet, um Daten mit geringer Vielfalt zu erfassen.
Figure 2. Driver license, an example of a structured document

Halbstrukturierte Dokumente
Halbstrukturierte Dokumente sind Dokumente, die keinem strikten Format wie strukturierten Formularen folgen und nicht an bestimmte Datenfelder gebunden sind. Diese haben keine feste Form, sondern folgen einem ausreichend gängigen Format. Sie enthalten feste und variable Teile, wie Tabellen. Sie können auch Absätze enthalten, aber Daten liegen hauptsächlich in Schlüssel-Wert-Paaren vor. Halbstrukturierte Dokumente beinhalten:
- Rechnungen
- Belege
- Bestellungen
- Medizinische Laborberichte
- Bank Statements
- Betriebskostenabrechnungen
Figure 3. Invoice, an example of a semi-structured document

Unstrukturierte Dokumente
Unstrukturierte Dokumente sind Dateien, die keinem bestimmten oder organisierten Modell folgen. Sie haben kein festes Format und die enthaltenen Informationen werden oft unstrukturiert dargestellt, was die Verarbeitung durch Roboter erschwert. Während Menschen diese Dokumente leicht verstehen können, können die Daten für Maschinen schwierig zu interpretieren sein. Unstrukturierte Dokumente können viele Formen annehmen, einschließlich:
- Verträge
- Mietverträge
- Geschäftsberichte
- Vereinbarungen
- Nachrichtenartikel
Figure 4. License agreement, an example of an unstructured document
