document-understanding
2024.10
true
UiPath logo, featuring letters U and I in white

Document Understanding-Benutzerhandbuch für moderne Projekte

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Letzte Aktualisierung 20. Nov. 2024

Dokumenttypen

Ein Dokumenttyp ist die Definition eines logischen Dokuments, der von verschiedenen Geschäftsprozessen verarbeitet werden muss.

Was ist ein Dokumenttyp und was kann er enthalten?

Zu den Dokumenttypen gehören Rechnungen, Gesundheitsakten, Steuerbescheide, Verträge und andere. Ein Dokumenttyp enthält in der Regel neben einem Namen, einer Gruppe und einer Kategorie eine Sammlung von Feldern.

Beispielsweise enthalten Rechnungen in der Regel die folgenden Informationen:
  • Anbietername, Anbieteradresse, Rechnungsname, Rechnungsadresse
  • Rechnungsnummer, Bestellnummer, Zahlungsbedingungen, Fälligkeitsdatum
  • Nettobetrag, Steuerbetrag, Rabatt, Gesamtbetrag
  • Umsatzsteuer-Identifikationsnummer, Umsatzsteuersatz
  • Bankkontonummer, Bankname, SWIFT, IBAN
Abbildung 1. Beispiel für eine Rechnung

Dokumenttypformate

Dokumenttypen können basierend auf ihrem Format klassifiziert werden. Einige Dokumenttypen haben einen sehr strukturierten Inhalt, während andere hauptsächlich aus freiem Text bestehen.

Dokumente werden in drei Hauptformate klassifiziert:
  • Structured
  • Halbstrukturiert
  • Unstrukturiert
Hinweis: Dokumente können oft eine Kombination dieser drei Kategorien sein. Eine Datei kann eine strukturierte Überschrift gefolgt von einem unstrukturierten Freiforminhalt haben. Sie können auch unstrukturierte Inhalte mit bestimmten Informationen enthalten, die immer in einem sehr strukturierten oder sich wiederholenden Kontext erscheinen.

Strukturierte Dokumente

Beispiele für strukturierte Dokumente:
  • Umfragen
  • Fragebögen
  • Steuerformulare
  • Passports
  • Lizenzen
  • Stundentabellen

Diese Dokumente sind dazu konzipiert, Informationen in einem bestimmten Format zu sammeln. Sie enthalten in der Regel Schlüssel-Wert-Paare, Tabellen, handschriftlichen Text, Signaturen und Kontrollkästchen. Diese Dokumente leiten den Benutzer, indem sie genaue Bereiche für die Eingabe der einzelnen Daten vorsehen. Solche Dokumente werden allgemein als Formulare bezeichnet und verwendet, um Daten mit geringer Vielfalt zu erfassen.

Abbildung 2. Führerschein, ein Beispiel für ein strukturiertes Dokument docs image

Halbstrukturierte Dokumente

Halbstrukturierte Dokumente sind Dokumente, die keinem strikten Format wie strukturierten Formularen folgen und nicht an bestimmte Datenfelder gebunden sind. Diese haben keine feste Form, sondern folgen einem ausreichend gängigen Format. Sie enthalten feste und variable Teile, wie Tabellen. Sie können auch Absätze enthalten, aber Daten liegen hauptsächlich in Schlüssel-Wert-Paaren vor. Halbstrukturierte Dokumente beinhalten:
  • Rechnungen
  • Belege
  • Bestellungen
  • Medizinische Laborberichte
  • Bank Statements
  • Betriebskostenabrechnungen
Abbildung 3. Rechnung, ein Beispiel für ein halbstrukturiertes Dokument docs image

Unstrukturierte Dokumente

Unstrukturierte Dokumente sind Dateien, die keinem bestimmten oder organisierten Modell folgen. Sie haben kein festes Format und die enthaltenen Informationen werden oft unstrukturiert dargestellt, was die Verarbeitung durch Roboter erschwert. Während Menschen diese Dokumente leicht verstehen können, können die Daten für Maschinen schwierig zu interpretieren sein. Unstrukturierte Dokumente können viele Formen annehmen, einschließlich:
  • Verträge
  • Mietverträge
  • Geschäftsberichte
  • Vereinbarungen
  • Nachrichtenartikel
Abbildung 4. Lizenzvereinbarung, ein Beispiel für ein unstrukturiertes Dokument docs image

War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
Uipath Logo White
Vertrauen und Sicherheit
© 2005–2024 UiPath. Alle Rechte vorbehalten