document-understanding

latest

false

Wichtig :

Es kann 1–2 Wochen dauern, bis die Lokalisierung neu veröffentlichter Inhalte verfügbar ist.

Document Understanding-Benutzerhandbuch.

BEREITSTELLUNG:

Letzte Aktualisierung 9. Feb. 2026

Taxonomie – Übersicht

Was ist eine Taxonomie

Die Taxonomie beruht auf Metadaten, die das Document Understanding^TM-Framework in jedem seiner Schritte berücksichtigt.

Eine Taxonomie ist eine Sammlung von Dokumenttypen.
Ein Dokumenttyp ist die Definition eines logischen Dokumenttyps, der von verschiedenen Geschäftsprozessen verarbeitet werden muss. Beispiele für Dokumenttypen sind Rechnungen, Gesundheitsakten, IRS-Formulare W-2, Verträge usw. Ein Dokumenttyp enthält in der Regel neben einem Namen, einer Gruppe und einer Kategorie (zur leichteren Handhabung) eine Sammlung von Feldern.
Ein Feld ist eine Information, die von einem bestimmten Dokumenttyp erwartet und erfasst wird.

Eine Taxonomie ist eine hierarchische Struktur, die das Schema der Informationen enthält, die das Document Understanding Framework verwenden wird. Jede Entitätsdefinition (für Dokumenttypen oder Felder) in der Taxonomie hat eine eindeutige ID.

Wie hilft sie bei der Dokumentklassifizierung?

Wenn Sie eingehende Dateien in verschiedene Dokumenttypen klassifizieren möchten, sollte die Taxonomie die Dokumenttypen enthalten, die Sie speziell behandeln möchten. Damit können Sie Ihre Document Understanding-Prozesse basierend auf einem einheitlichen Datenschema konfigurieren: der Struktur Ihrer Taxonomie.

Wie hilft sie bei der Datenextraktion?

Wenn Sie Daten aus bestimmten Dokumenttypen extrahieren möchten, enthält die Taxonomie die Liste der relevanten Felder für die automatische Datenextraktion. Diese ermöglichen die Konfiguration verschiedener Extraktionsmethoden und -regeln erneut basierend auf einem Single-Source-of-Truth-Datenschema: der Struktur Ihres Dokumenttyps.

Feldtypen und Details

Ein Feld kann abgeleitete Teile enthalten: formatierte Informationen, die vom zugrundeliegenden Textwert im Dokument extrahiert oder bearbeitet wurden.

Feldtyp	Mehrere Werte möglich	Zweck	Abgeleitete Teile für die Formatierung	Zusätzliche Angaben
Text	Ja	Textangaben	Keine Angabe	Keine Angabe
Nummer	Ja	Numerische Werte	Wert (bis zu acht Dezimalstellen)	Keine Angabe
Datum	Ja	Daten	Tag Monat Jahr	Datumsfelder ermöglichen die Definition eines Erwarteten Formats, bei dem es sich um eine MSDN-konforme Datumsformatzeichenfolge handeln muss (z. B. `dd-MM-yyyy` oder `MM, dd, yyyy`). Dieses Format kann von der Aktivität Data Extraction Scope verwendet, wenn versucht wird, ein Datum in die Bestandteile „Tag“, „Monat“ und „Jahr“ aufzuschlüsseln.
Name	Ja	Personennamen	Gegebener Name Zweiter Vorname Nachname	Keine Angabe
Address	Ja	Adressen	Adresszeile 1 Adresszeile 2 Adresszeile 3 Stadt Staat / Bezirk / Bundesland Land Postleitzahl	Keine Angabe
Set (Satz)	Ja	Definiert eine Liste möglicher Werte aus einem vordefinierten Satz	Keine Angabe	Ein Set-Feld muss die zulässigen Optionen als Werte definieren. Diese sind in der Validierungsstation widergespiegelt.
Boolescher	Ja	Ja/Nein-Werte	Keine Angabe	Ein Boolesches Feld kann als mögliche Werte nur Ja oder Nein haben und ist in der Validierungsstation widergespiegelt.
Tabelle	Nein	Tabellendaten	Keine Angabe	Ein Tabellenfeld enthält die Definition der Spalten.
Tabellenspalte	Nein	Jede Zelle in der Tabelle.	Keine Angabe	Tabellenspalten in einem Tabellenfeld sind als eines der regulären Felder der Komponentenliste definiert. Sie können nicht vom Typ „Tabelle“ sein.

Ausnahmen

Sie können Standard als Ausnahmegründe auf Taxonomie-Ebene definieren.Diese vordefinierten Gründe werden in der Validierungsstation angezeigt, wenn ein Benutzer ein Dokument als Ausnahme meldet.

Dies ermöglicht es Geschäftsanwendern, Dokumente basierend auf vordefinierten Gründen (den Gründen für Ausnahmen, die in Taxonomiemanager definiert sind) als Ausnahmen zu markieren.

Ein Benutzer kann beispielsweise eine Rechnung erwarten, aber einen Datensatz erhalten, ein Dokument auf Koreanisch erwarten, aber eines auf Russisch erhalten oder ein lesbares Dokument erwarten, aber eines mit sehr schlechter Qualität erhalten.

Die von Ihnen definierten Gründe werden in einer Dropdownliste angezeigt, aus der der Benutzer die am besten geeignete Option auswählen kann. Basierend auf dem ausgewählten Grund kann die Fortsetzung der Automatisierung konfiguriert werden, um zu bestimmen, welcher Verarbeitungspfad als nächstes verwendet werden soll.

Andere in der Taxonomie erfasste Informationen

Die Taxonomie enthält zudem die Liste der Gruppen und Kategorien sowie eine Sammlung der unterstützten Sprachen, die den zu bearbeitenden Dokumenten zugeordnet werden können. Um beispielsweise Dokumente auf Japanisch und Englisch zu bearbeiten, muss das Tag der unterstützten Sprachen ihren jeweiligen Anzeigenamen und Sprachencode enthalten. Für Ausnahmefälle empfehlen wir, eine nicht bestimmte Sprache (Code und) hinzuzufügen.

Taxonomie-Erweiterungsmethoden

Serialisieren (Serialize) ()

Bei Aufruf mit einem DocumentTaxonomy-Objekt gibt die Serialize()-Methode eine JSON-Darstellung des Objekts zurück, sodass es gespeichert und zur späteren Verwendung wieder aufgerufen werden kann.

Deserialisieren (Deserialize) (String))

Die statische Erweiterung DocumentTaxonomy.Deserialize(jsonString) gibt ein Objekt DocumentTaxonomy zurück, das die mit JSON verschlüsselten Daten enthält, die als Parameter übergeben wurden.

Felder abrufen (GetFields (String))

Bei Aufruf auf einem DocumentTaxonomy -Objekt gibt die GetFields()-Methode, die mit einem DocumentTypeId-String aufgerufen wird, eine Liste von Feldern zurück, die in diesem Dokumenttyp definiert sind.

Wie die Taxonomie Ihres Projekts erstellt und bearbeitet wird

Sobald das UiPath.IntelligentOCR.Activities-Paket in Ihrem Projekt in UiPath® Studio installiert wurde, wird im Hauptband der Design-Registerkarte von Studio die Schaltfläche für den Taxonomiemanager angezeigt. Verwenden Sie den Taxonomiemanager-Assistenten, um Ihre Projekttaxonomie zu bearbeiten.

Die Taxonomie wird in einer Datei in Ihrem UiPath Studio-Projekt im Ordner DocumentProcessing und in der taxonomy.json-Datei gespeichert.

Die Datei wird automatisch erstellt, wenn Sie den Assistenten des Taxonomiemanagers zum ersten Mal öffnen. Sie können den genauen Speicherort der Datei im Taxonomiemanager überprüfen, indem Sie den Mauszeiger über die Taste ziehen. Alternativ können Sie jedes Mal, wenn Sie den Taxonomiemanager öffnen, in der oberen rechten Ecke eine Popup-Nachricht sehen, die Sie über den Speicherort der Datei informiert. Wenn ein Projekt aus Studio veröffentlicht wird, wird die Taxonomie sowie ein Artefakt des Projekts veröffentlicht.

Die taxonomy.json-Datei ist für jedes Projekt eindeutig, kann aber wiederverwendet werden, wenn Sie sie manuell in ein neues Projekt kopieren. Dazu müssen Sie einfach ein neues Projekt erstellen, dann zum Projektordner wechseln und die Datei mit der Taxonomie Ihrer Wahl in den richtigen Speicherort (in den Ordner DocumentProcessing) kopieren.

Wichtig: Zum Zweck der Datenintegrität empfehlen wir, die Taxonomie immer mit dem Taxonomiemanager zu bearbeiten.

Wie die Taxonomie in Ihrem Projekt verwendet wird

Die Taxonomie für das Document Understanding ist als Objekt im gesamten Document Understanding-Framework erforderlich.

Die einfachste und bequemste Möglichkeit, Ihr Objekt zu laden, ist die Verwendung der Aktivität Load Taxonomy. Sobald Ihr Taxonomieobjekt geladen wurde, können Sie es in allen nachfolgenden Framework-Komponenten verwenden, die es erfordern.

Erweiterte Anwendungsfälle

Wenn Sie Ihre Taxonomie an einem anderen Ort speichern, können Sie sie weiterhin in Ihr Projekt laden (sobald Sie den String-Inhalt der Taxonomiedatei erhalten haben, z. B. in einer myTaxonomyContentString-Variablen), indem Sie eine einfache Assign-Aktivität wie folgt verwenden:

myTaxonomy = DocumentTaxonomy.Deserialize(myTaxonomyContentString)
Wenn Ihr Anwendungsfall dies erfordert, dann denken Sie daran, dass die Taxonomie ein POCO (Plain Old Class Object) ist, das bei Bedarf sogar während der Ausführung bearbeitet werden kann.

Auf dieser Seite

Was ist eine Taxonomie
Wie hilft sie bei der Dokumentklassifizierung?
Wie hilft sie bei der Datenextraktion?
Feldtypen und Details
Ausnahmen
Andere in der Taxonomie erfasste Informationen
Taxonomie-Erweiterungsmethoden
Serialisieren (Serialize) ()
Deserialisieren (Deserialize) (String))
Felder abrufen (GetFields (String))
Wie die Taxonomie Ihres Projekts erstellt und bearbeitet wird
Wie die Taxonomie in Ihrem Projekt verwendet wird
Erweiterte Anwendungsfälle

War diese Seite hilfreich?

Vorherige (previous)Taxonomie

WeiterTaxonomieverwaltung