activities

latest

false

Wichtig :

Bitte beachten Sie, dass dieser Inhalt teilweise mithilfe von maschineller Übersetzung lokalisiert wurde. Es kann 1–2 Wochen dauern, bis die Lokalisierung neu veröffentlichter Inhalte verfügbar ist.

Document Understanding-Aktivitäten

Letzte Aktualisierung 17. Feb. 2026

Über das IntelligentOCR-Aktivitätspaket

UiPath.IntelligentOCR.Activities enthält die Infrastruktur zur Aktivierung von Dokumentverarbeitungsabläufen mit einem vollständigen, offenen und erweiterbaren Ansatz.

Hinweis: Beim Installieren des UiPath.IntelligentOCR.Activities -Pakets wird das UiPath.DocumentUnderstanding.ML.Activities -Paket automatisch installiert, um die ML-basierte Klassifizierung und Extraktion durchzuführen.

Bekannte Einschränkung

Wenn Sie Aktivitäten vom Typ „Wait for“ verwenden, die Workflows anhalten, und Sie mit DataTable -Variablen arbeiten, ist es wichtig, dass DataTable -Variablen serialisierbar sind. Wenn eine DataTable -Variable beispielsweise mit new System.Data.DataTable initialisiert wird, wird sie nicht mehr serialisierbar, und dies kann dazu führen, dass Ihre Projektausführung fehlschlägt. Um dies zu verhindern, können Sie entweder: den Standardwert der DataTable -Variablen leer lassen oder der DataTable -Variablen einen Namen zuweisen, z. B. new System.Data.DataTable("MyTable").

Ersetzen entfernter Versionen

Die folgende Tabelle zeigt die entfernten Paketversionen und die empfohlene Version, die stattdessen verwendet werden soll.

Tabelle 1. Die entfernten Versionen und deren empfohlene Ersatzversionen
	Empfohlene Version
4.3.0-Vorschau \| 4.4.0-Vorschau	4.5.2
2.1.0 \| 2.2.0 \| 2.3.0	4.0.1
1.4.0 \| 1.5.0 \| 1.6.0 \| 1.6.1 \| 2.0.0 \| 2.0.1	2.0.2
1.2.0 \| 1.2.1 \| 1.3.0	1.3.2

Wichtig

Ab Version v6.19.0 wird bei der Installation des Pakets UiPath.IntelligentOCR.Activities in einem Projekt automatisch auch das Paket UiPath.DocumentUnderstanding.ML.Activities installiert. Sie müssen es nicht separat installieren.
Wenn Sie UiPath® Studio 2023.4.4 oder eine frühere Version verwenden, stellen Sie sicher, dass Sie die neueste Version der Windows .NET 6.0 Desktop-Runtime installieren.

Versionskompatibilität

Die Aktualisierung von UiPath.IntelligentOCR.Activities erfordert auch ein Update für das UiPath.UIAutomation.Activities -Paket und für das UiPath.OCR.Activities- Paket, wenn es im Projekt enthalten ist.

UiPath.IntelligentOCR.Activities und UiPath.DocumentUnderstanding.Activities dürfen nicht zusammen im selben Projekt verwendet werden. Das Paket UiPath.IntelligentOCR.Activities sollte für Windows-Workflows (oder Legacy-Workflows) verwendet werden, während das Paket UiPath.DocumentUnderstanding.Activities für plattformübergreifende Workflows verwendet werden sollte.

Hinweis: Bevor Sie die Funktion Überwachen verwenden, beachten Sie Folgendes:

Nur UiPath.DocumentUnderstanding.Activities v 2.7.0 oder neuere Versionen unterstützen Monitor;
Nur IntelligentOCR.Activities v6.20 oder neuere Versionen enthalten die Aktivität Document Understanding Project Extractor, die Monitor unterstützt

Unterstützte Formate

Das Aktivitätspaket IntelligentOCR kann einen der folgenden Dateitypen unterstützen: .png, .gif, .jpe, .jpg, .jpeg, .tiff, .tif, .bmp, und .pdf.

Unterstützung für die Projektsprache C#

Ab Version 4.10.0, Dieses Aktivitätspaket ist für die Verwendung in C#-Projekten validiert.

Funktionen

Dieser Abschnitt zeigt die verschiedenen Funktionalitäten des Pakets Intelligent.OCR.

Digitalisieren von Dokumenten

Dies können Sie mit der Aktivität Digitize Document erreichen. Dadurch wird der Text aus einer PDF-Datei oder einem Bild abgerufen, und zwar nur bei Bedarfmit der OCR-Engine Ihrer Wahl.

Während die Dokumente nacheinander verarbeitet werden, durchlaufen sie den Digitalisierungsprozess. Der Unterschied bei nicht digitalen (gescannten) Dokumenten besteht darin, dass Sie das OCR-Modul Ihrer Wahl anwenden müssen. Die Ausgaben dieses Schritts sind das Document Object Model und eine String-Variable, die den gesamten Dokumenttext enthält und an die nächsten Schritte übergeben wird.

Dokumente klassifizieren

Dies erreichen Sie mit der Aktivität Dokument klassifizieren ( Classify Document ). Auf diese Weise kann mithilfe eines Klassifizierungsalgorithmus identifiziert werden, um welchen Dokumenttyp es sich bei einer Datei handelt.

Nach der Digitalisierung wird das Dokument klassifiziert. Wenn Sie mit mehreren Dokumenttypen im selben Projekt arbeiten, müssen Sie zum ordnungsgemäßen Extrahieren von Daten wissen, mit welchem Dokumenttyp Sie arbeiten. Wichtig ist, dass Sie mehrere Klassifizierer im selben Scope verwenden, die Klassifizierer konfigurieren und später im Framework trainieren können. Die Klassifizierungsergebnisse helfen bei der Anwendung der richtigen Strategie bei der Extraktion.

Die folgende Liste zeigt die verfügbaren Klassifizierer:

Die Aktivität Keyword Based Classifier ist der erste Klassifizierer dieser Art und zielt auf die Klassifizierung von Dokumenten mit Titel ab.
Die Aktivität Intelligent Keyword Classifier kann Dateien nicht nur klassifizieren, sondern auch „aufteilen“, die mehrere Dokumenttypen enthalten.
Die Aktivität Machine Learning Classifier kann Ihre Dateien mit einem leistungsstarken ML-Modell klassifizieren, das Sie entsprechend Ihren Anforderungen trainieren können.
Mit der Aktivität Generative Classifier können Sie Dokumente mithilfe generativer Modelle klassifizieren.

Automatische Klassifizierung validieren

Dies können Sie mit der Attended-Aktivität Present Classification Station erreichen, die eine Benutzeroberfläche für die Dokumentverarbeitung zur Validierung und Korrektur automatischer Klassifizierungsausgaben bietet.

Insbesondere für Anwendungsfälle, bei denen eine Dateiaufteilung involviert ist, wird dringend empfohlen, den Validierungsschritt der menschlichen Klassifizierung zu verwenden, um sicherzustellen, dass die nachgelagerte Verarbeitung für die Datenextraktion ordnungsgemäß funktioniert.

Eine Alternative zur Attended-Aktivität ist die Verwendung von Workflows mit langer Ausführungszeit, die die Zusammenarbeit zwischen Mensch und Roboter optimal ermöglichen. Die Aktivitäten Create Document Classification Action und Wait For Document Classification Action And Resume ermöglichen dieses Szenario.

Klassifizierer trainieren

Dies können Sie mit der Aktivität Train Classifiers Scope erreichen. Dadurch kann die Feedback-Schleife zu jedem lernfähigen Klassifizierungsalgorithmus geschlossen werden. Ziehen Sie Ihre Klassifizierertrainer innerhalb dieser Scope-Aktivität und aktivieren Sie sie mit dem Assistenten Klassifizierer konfigurieren , um sicherzustellen, dass die von Menschen über die Klassifizierungsstation oder Validierungsstation validierten Informationen von Ihren Klassifizierern verwendet werden, um ihre eigene Leistung zu verbessern.

Die Klassifizierung ist so effizient wie die verwendeten Klassifizierer. Wenn ein Dokument nicht ordnungsgemäß klassifiziert wurde, war es den aktiven Klassifizierern unbekannt. Das Framework bietet die Möglichkeit, die Klassifizierer zu trainieren, um die Erkennung der Dokumentklassen zu verbessern.

Im Folgenden finden Sie eine Liste der verfügbaren Klassifizierertrainer:

Der Keyword Based Classifier Trainer ist die Traineraktivität gekoppelt mit dem Keyword Based Classifier.
Der Intelligent Keyword Classifier Trainer aktiviert die Feedback-Schleife für den Intelligent Keyword Classifier.
Der Machine Learning Classifier Trainer ist die Traineraktivität zusammen mit dem Machine Learning Classifier.

Extrahieren von Daten aus Dokumenten

Sie können dies mit der Aktivität Data Extraction Scope erreichen. Dies ermöglicht die Verwendung eines beliebigen Datenextraktionsalgorithmus zum Identifizieren verschiedener Felder in einem klassifizierten Dokument.

Bei der Extraktion werden nur die Daten abgerufen, an denen Sie interessiert sind, aus einem bestimmten Dokumenttyp. Das Extrahieren bestimmter Daten aus einem fünfseitigen Dokument ist beispielsweise ziemlich mühsam, wenn Sie dies mit Zeichenfolgenmanipulation tun möchten. In diesem Framework können Sie verschiedene Extraktoren für die verschiedenen Dokumentstrukturen im selben Datenextraktionsumfang verwenden. Die Extraktionsergebnisse werden zur Validierung weitergereicht.

Im Folgenden finden Sie eine Liste der verfügbaren Extraktoren:

Der RegEx Based Extractor ist ein grundlegender Datenextraktor, der reguläre Ausdrücke anwendet, um die besten Kandidaten für ein bestimmtes Feld zu identifizieren.
Der Form Extractor verwendet vordefinierte Vorlagen, um die Verarbeitung strukturierter Dokumente mit fester Form zu ermöglichen.
The Machine Learning Extractor leverages the power of AI and Machine Learning to identify information in structured or semi-structured documents by either using one of UiPath®'s public data extraction services or by calling custom trained Machine Learning models that you can build and host in AI Center.
The Generative Extractor allows you to extract documents using generative models.

Ergebnisse der automatischen Datenextraktion validieren

Dies können Sie mit der Attended-Aktivität Present Validation Station erreichen, die eine Benutzeroberfläche für die Dokumentverarbeitung zur Datenvalidierung und -korrektur darstellt.

Die extrahierten Daten können von einem menschlichen Benutzer über die Validation Stationvalidiert werden. Eine bewährte Methode besteht darin, eine Logik um die Entscheidung herum aufzubauen, einen menschlichen Validierungsschritt hinzuzufügen oder nicht, mit Regeln, die vom spezifischen Anwendungsfall abhängen, der implementiert werden soll. Validierungsergebnisse können dann exportiert und in weiteren Automatisierungsaktivitäten verwendet werden.
Sie können auch die menschliche Validierung durch Workflows mit langer Ausführungszeit aktivieren und die Zusammenarbeit zwischen Mensch und Roboter optimieren, indem Sie die Aktivitäten Create Document Validation Action und Wait for Document Validation Action and Resume verwenden.

Zugextraktoren

Dies können Sie mit der Aktivität Train Extractors Scope erreichen. Dadurch kann die Feedback-Schleife zu jedem lernfähigen Datenextraktionsalgorithmus geschlossen werden. Ziehen Sie Ihre Extraktortrainer per Drag-and-drop in diese Scope-Aktivität und aktivieren Sie sie mit dem Assistenten Extraktoren konfigurieren , um sicherzustellen, dass die von Menschen über die Validation Station validierten Informationen von Ihren Extraktoren verwendet werden, um ihre eigene Leistung zu verbessern.

Die Extraktion ist ebenso effizient wie die verwendeten Extraktoren. Wenn Feldwerte nicht ordnungsgemäß extrahiert wurden, bedeutet dies, dass sie den aktiven Extraktoren unbekannt waren. Das Framework bietet die Möglichkeit, die Extraktoren zu trainieren, um die Erkennung von Feldwerten zu verbessern.

The Machine Learning Extractor Trainer closes the feedback loop for ML-based data extraction, by collecting the data required for retraining a Machine Learning model hosted in AI Center. This activity is the companion of the Machine Learning Extractor activity.

Extrahierte Informationen exportieren

Sie können dies mit der Aktivität Export Extraction Results erreichen. Auf diese Weise können Sie die komplexe Struktur der extrahierten Daten in ein einfaches DataSet (Sammlung von DataTables) exportieren.

Sobald Sie über Ihre validierten Informationen verfügen, können Sie sie so verwenden, wie sie sind, oder sie in einem DataTable-Format speichern, das sehr einfach in eine Excel-Datei konvertiert werden kann.

Das UiPath.IntelligentOCR.Activities -Paket ist mit jeder benutzerdefinierten Klassifizierungs- oder Datenextraktionsaktivität kompatibel, die auf dem öffentlichen UiPath.DocumentProcessing.Contracts -Paket basiert. Es bietet volle Flexibilität. Sie können Ihren eigenen Algorithmus speziell für Ihren Anwendungsfall erstellen und ihn mit jeder Drittanbieterlösung zur Dokumentklassifizierung und Datenextraktion integrieren.

Die folgenden Versionen des Pakets wurden aus dem offiziellen Feed entfernt. Bei Problemen wenden Sie sich bitte an unsere Supportteams.

Auf dieser Seite