UiPath Documentation
document-understanding
2024.10
false
Wichtig :
Es kann 1–2 Wochen dauern, bis die Lokalisierung neu veröffentlichter Inhalte verfügbar ist.
UiPath logo, featuring letters U and I in white

Document Understanding modern projects user guide

Letzte Aktualisierung 6. Apr. 2026

Dokumenttypen

Ein Dokumenttyp ist die Definition eines logischen Dokuments, der von verschiedenen Geschäftsprozessen verarbeitet werden muss.

Was ist ein Dokumenttyp und was kann er enthalten?

Zu den Dokumenttypen gehören Rechnungen, Gesundheitsakten, Steuerbescheide, Verträge und andere. Ein Dokumenttyp enthält in der Regel neben einem Namen, einer Gruppe und einer Kategorie eine Sammlung von Feldern.

Beispielsweise enthalten Rechnungen in der Regel die folgenden Informationen:

  • Anbietername, Anbieteradresse, Rechnungsname, Rechnungsadresse
  • Rechnungsnummer, Bestellnummer, Zahlungsbedingungen, Fälligkeitsdatum
  • Nettobetrag, Steuerbetrag, Rabatt, Gesamtbetrag
  • Umsatzsteuer-Identifikationsnummer, Umsatzsteuersatz
  • Bankkontonummer, Bankname, SWIFT, IBAN

Figure 1. Invoice example Beispiel einer Rechnung, die Informationen wie Rechnungsadresse, Lieferadresse, Rechnungsnummer, Rechnungsdatum, Stückpreis, Gesamtpreis oder Unterschrift enthält.

Dokumenttypformate

Dokumenttypen können basierend auf ihrem Format klassifiziert werden. Einige Dokumenttypen haben einen sehr strukturierten Inhalt, während andere hauptsächlich aus freiem Text bestehen.

Dokumente werden in drei Hauptformate klassifiziert:

  • Structured
  • Halbstrukturiert
  • Unstrukturiert
Hinweis:

Documents can often be a combination of these three categories. A file can have a structured heading, followed by an unstructured, free-form content. They can also contain unstructured content with specific information that always appears in a very structured or repeating context.

Strukturierte Dokumente

Beispiele für strukturierte Dokumente:

  • Umfragen
  • Fragebögen
  • Steuerformulare
  • Passports
  • Lizenzen
  • Stundentabellen

Diese Dokumente sind dazu konzipiert, Informationen in einem bestimmten Format zu sammeln. Sie enthalten in der Regel Schlüssel-Wert-Paare, Tabellen, handschriftlichen Text, Signaturen und Kontrollkästchen. Diese Dokumente leiten den Benutzer, indem sie genaue Bereiche für die Eingabe der einzelnen Daten vorsehen. Solche Dokumente werden allgemein als Formulare bezeichnet und verwendet, um Daten mit geringer Vielfalt zu erfassen.

Figure 2. Driver license, an example of a structured document Beispiel eines Führerscheins, der Informationen wie Name, Adresse, Geburtsdatum, Seriennummer und andere enthält.

Halbstrukturierte Dokumente

Halbstrukturierte Dokumente sind Dokumente, die keinem strikten Format wie strukturierten Formularen folgen und nicht an bestimmte Datenfelder gebunden sind. Diese haben keine feste Form, sondern folgen einem ausreichend gängigen Format. Sie enthalten feste und variable Teile, wie Tabellen. Sie können auch Absätze enthalten, aber Daten liegen hauptsächlich in Schlüssel-Wert-Paaren vor. Halbstrukturierte Dokumente beinhalten:

  • Rechnungen
  • Belege
  • Bestellungen
  • Medizinische Laborberichte
  • Bank Statements
  • Betriebskostenabrechnungen

Figure 3. Invoice, an example of a semi-structured document Beispiel einer Rechnung, die Informationen wie Rechnungsadresse, Lieferadresse, Rechnungsnummer, Rechnungsdatum, Stückpreis, Gesamtpreis oder Unterschrift enthält.

Unstrukturierte Dokumente

Unstrukturierte Dokumente sind Dateien, die keinem bestimmten oder organisierten Modell folgen. Sie haben kein festes Format und die enthaltenen Informationen werden oft unstrukturiert dargestellt, was die Verarbeitung durch Roboter erschwert. Während Menschen diese Dokumente leicht verstehen können, können die Daten für Maschinen schwierig zu interpretieren sein. Unstrukturierte Dokumente können viele Formen annehmen, einschließlich:

  • Verträge
  • Mietverträge
  • Geschäftsberichte
  • Vereinbarungen
  • Nachrichtenartikel

Figure 4. License agreement, an example of an unstructured document Beispiel eines Lizenzvereinbarungsdokuments, ein unstrukturiertes Dokument.

  • Was ist ein Dokumenttyp und was kann er enthalten?
  • Dokumenttypformate
  • Strukturierte Dokumente
  • Halbstrukturierte Dokumente
  • Unstrukturierte Dokumente

War diese Seite hilfreich?

Verbinden

Benötigen Sie Hilfe? Support

Möchten Sie lernen? UiPath Academy

Haben Sie Fragen? UiPath-Forum

Auf dem neuesten Stand bleiben