Abonnieren

UiPath Document Understanding

UiPath Document Understanding

Einleitung

Das UiPath Document Understanding-Framework erleichtert die Verarbeitung eingehender Dateien, von der Dateiendigitalisierung bis zur Validierung der extrahierten Daten, alles in einer offenen, erweiterbaren und vielseitigen Umgebung.

Document Understanding ist so konzipiert, dass Sie verschiedene Ansätze kombinieren können, um Informationen aus mehreren Dokumenttypen zu extrahieren. Das Hauptziel besteht darin, die Datenextraktion so einfach wie möglich zu machen: das Erstellen eines einzigen Workflows, der Daten aus einer Vielzahl von Dokumenten extrahiert.

Bevor Sie das Document Understanding-Framework verwenden, sollten Sie sich mit den folgenden Document Understanding-Framework-Komponenten vertraut machen:

  • Taxonomie
    What documents need to be processed and what data is required from them?
    Used to define the document types and the pieces of information targeted for data extraction (fields) for each document type, and formalizes this information into a dedicated Taxonomy structure. This metadata information is managed through the Taxonomy Manager.

  • Digitalisierung
    What does this file contain?
    Wird verwendet, um den Textinhalt und die Struktur des eingehenden Dokuments abzurufen, wodurch eine Datei in maschinenlesbaren Inhalt umgewandelt wird, der im Anschluss weiterverarbeitet werden kann.

  • Dokumentklassifizierung
    What types of documents from the taxonomy are found in this file?
    Wird verwendet, um automatisch zu bestimmen, welche Dokumenttypen sich in einer digitalisierten Datei befinden.

  • Dokumentklassifizierungsvalidierung
    Is the predicted classification correct? This is how I can review and correct it.
    Wird zur Unterstützung der menschlichen Validierung und Korrektur der Ergebnisse von der automatischen Klassifizierung und Dokumentaufteilung verwendet.

  • Classification Training
    Did the human review the data? This is how the robot can learn from it.
    Wird verwendet, um die von Menschen validierten Informationen an die Klassifizierer zurückzusenden, um sie zur Verbesserung ihrer zukünftigen Vorhersagen zu verwenden.

  • Datenextraktion
    What data can be found in this particular document?
    Wird verwendet, um die für den identifizierten Dokumenttyp erforderlichen Informationen innerhalb des angegebenen Eingabedokuments und des Klassifizierungsseitenbereichs zu erfassen.

  • Datenextraktionsvalidierung
    Is the extracted information correct? This is how I can review and correct it.
    Wird zur Unterstützung der menschlichen Validierung und Korrektur der Ergebnisse von den automatisch extrahierten Daten verwendet.

  • Datenextraktionstraining
    Did the human review the data? This is how the robot can learn from it.
    Wird verwendet, um die von Menschen validierten extrahierten Daten an die Extraktoren zurückzusenden, um sie zur Verbesserung ihrer Extraktionsvorhersagen zu verwenden.

  • Datenverbrauch
    Wird verwendet, um die validierten Daten zu exportieren und sie zu verbrauchen.

  • Mess- und Ladelogik
    Wird verwendet, um den Verbrauch von Einheiten pro Seite für jeden verfügbaren Dienst zu erklären.

Das folgende Diagramm zeigt die Document Understanding-Framework-Komponenten und wie sie zusammenhängen:

15161516

The Document Understanding framework is found in the UiPath.IntelligentOCR.Activities package. Once the UiPath.IntelligentOCR.Activities package is installed, the Taxonomy Manager wizard appears in the top ribbon of the UiPath Studio. This same package contains all the core document understanding framework activities.

The scope activities (Classify Document Scope, Data Extraction Scope, Train Classifiers Scope, Train Extractors Scope) that are part of the Document Understanding framework allow you to use any document classification and data extraction algorithms that fit your use case and then train these algorithms.

The Document Understanding framework can be used not only with the out-of-the-box classifiers and extractors but also with any custom-built ones. These can be created using the abstract classes from the UiPath.DocumentProcessing.Contracts package and can be implemented as classification or data extraction activities. Custom-built OCR engines can also be created using the abstract classes from the UiPath.OCR.Contracts package.

Ressourcen

Dedicated Document Understanding courses can be found in the UiPath RPA Academy.

The UiPath Community Forum is the place for getting support from our evergrowing community of users.

Vor ungefähr einem Jahr aktualisiert


Einleitung


Auf API-Referenzseiten sind Änderungsvorschläge beschränkt

Sie können nur Änderungen an dem Textkörperinhalt von Markdown, aber nicht an der API-Spezifikation vorschlagen.