UiPath Documentation
document-understanding
2024.10
false
Wichtig :
Es kann 1–2 Wochen dauern, bis die Lokalisierung neu veröffentlichter Inhalte verfügbar ist.
UiPath logo, featuring letters U and I in white

Document Understanding-Benutzerhandbuch.

Letzte Aktualisierung 6. Apr. 2026

Einleitung

The UiPath® Document UnderstandingTM framework facilitates the processing of incoming files, from file digitization to extracted data validation, all in an open, extensible, and versatile environment.

Document Understanding ist so konzipiert, dass Sie verschiedene Ansätze kombinieren können, um Informationen aus mehreren Dokumenttypen zu extrahieren. Das Hauptziel besteht darin, die Datenextraktion so einfach wie möglich zu machen: das Erstellen eines einzigen Workflows, der Daten aus einer Vielzahl von Dokumenten extrahiert.

Bevor Sie das Document Understanding-Framework verwenden, sollten Sie sich mit den folgenden Document Understanding-Framework-Komponenten vertraut machen:

  • Taxonomie What documents need to be processed and what data is required from them? Used to define the document types and the pieces of information targeted for data extraction (fields) for each document type, and formalizes this information into a dedicated Taxonomy structure. This metadata information is managed through the Taxonomy Manager.
  • Digitalisierung Was enthält diese Datei? Wird verwendet, um den Textinhalt und die Struktur des eingehenden Dokuments abzurufen, wodurch eine Datei in maschinenlesbaren Inhalt umgewandelt wird, der im Anschluss weiterverarbeitet werden kann.
  • Dokumentklassifizierung Welche Dokumenttypen von der Taxonomie befinden sich in dieser Datei? Wird verwendet, um automatisch zu bestimmen, welche Dokumenttypen sich in einer digitalisierten Datei befinden.
  • Dokumentklassifizierungsvalidierung Ist die vorhergesagte Klassifizierung korrekt? So kann ich sie überprüfen und korrigieren. Wird zur Unterstützung der menschlichen Validierung und Korrektur der Ergebnisse von der automatischen Klassifizierung und Dokumentaufteilung verwendet.
  • Klassifizierungstraining Hat der Mensch die Daten überprüft? So kann der Roboter daraus lernen. Wird verwendet, um die von Menschen validierten Informationen an die Klassifizierer zurückzusenden, um sie zur Verbesserung ihrer zukünftigen Vorhersagen zu verwenden.
  • Datenextraktion Welche Daten befinden sich in diesem spezifischen Dokument? Erfasst die für den identifizierten Dokumenttyp erforderlichen Informationen innerhalb des angegebenen Eingabedokuments und des Klassifizierungsseitenbereichs.
  • Datenextraktionsvalidierung Sind die extrahierten Informationen korrekt? So kann ich sie überprüfen und korrigieren. Unterstützt die menschliche Validierung und Korrektur der Ergebnisse von den automatisch extrahierten Daten.
  • Datenextraktionstraining Hat der Mensch die Daten überprüft? So kann der Roboter daraus lernen. Sendet die von Menschen validierten extrahierten Daten an die Extraktoren zurück, um sie zur Verbesserung ihrer Extraktionsvorhersagen zu verwenden.
  • Datenverbrauch wird verwendet, um die validierten Daten zu exportieren und sie zu verbrauchen.
  • Mess- und Ladelogik wird verwendet, um den Verbrauch von Einheiten pro Seite für jeden verfügbaren Dienst zu erklären.

Folgendes Diagramm zeigt die Komponenten von Document Understanding Framework und deren Beziehung zueinander:

Diagramm zur Beschreibung des Document Understanding Framework

The Document Understanding framework is found in the UiPath.IntelligentOCR.Activities package. Once the UiPath.IntelligentOCR.Activities package is installed, the Taxonomy Manager wizard appears in the top ribbon of the UiPath Studio. This same package contains all the core document understanding framework activities.

Die Scope-Aktivitäten (Classify Document Scope, Data Extraction Scope, Train Classifiers Scope, Train Extractors Scope), die Teil des Document Understanding-Framework sind, ermöglichen es Ihnen, alle für Ihren Anwendungsfall geeigneten Dokumentklassifizierungs- und Datenextraktionsalgorithmen zu verwenden und diese Algorithmen dann zu trainieren.

The Document Understanding framework can be used not only with the out-of-the-box classifiers and extractors but also with any custom-built ones. These can be created using the abstract classes from the UiPath.DocumentProcessing.Contracts package and can be implemented as classification or data extraction activities. Custom-built OCR engines can also be created using the abstract classes from the UiPath.OCR.Contracts package.

Ressourcen

Spezielle Document Understanding-Kurse finden Sie in der UiPath RPA Academy.

Das UiPath Community Forum ist der Ort, an dem Sie Unterstützung von unserer ständig wachsenden Community erhalten.

  • Ressourcen

War diese Seite hilfreich?

Verbinden

Benötigen Sie Hilfe? Support

Möchten Sie lernen? UiPath Academy

Haben Sie Fragen? UiPath-Forum

Auf dem neuesten Stand bleiben