- Überblick
- Verträge zur Dokumentverarbeitung
- Versionshinweise
- Über die DocumentProcessing-Verträge
- Box-Klasse
- IPersistedActivity-Schnittstelle
- PrettyBoxConverter-Klasse
- IClassifierActivity-Schnittstelle
- IClassifierCapabilitiesProvider-Schnittstelle
- ClassifierDocumentType-Klasse
- ClassifierResult-Klasse
- ClassifierCodeActivity-Klasse
- ClassifierNativeActivity-Klasse
- ClassifierAsyncCodeActivity-Klasse
- ClassifierDocumentTypeCapability-Klasse
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- ExtractorAsyncCodeActivity-Klasse
- ExtractorCodeActivity-Klasse
- ExtractorDocumentType-Klasse
- ExtractorDocumentTypeCapabilities-Klasse
- ExtractorFieldCapability-Klasse
- ExtractorNativeActivity-Klasse
- ExtractorResult-Klasse
- FieldValue Class
- FieldValueResult Class
- ICapabilitiesProvider-Schnittstelle
- IExtractorActivity-Schnittstelle
- ExtractorPayload-Klasse
- DocumentActionPriority-Enumeration
- DocumentActionData-Klasse
- DocumentActionStatus-Enumeration
- DocumentActionType-Enumeration
- DocumentClassificationActionData-Klasse
- DocumentValidationActionData-Klasse
- UserData-Klasse
- Document-Klasse
- DocumentSplittingResult-Klasse
- DomExtensions-Klasse
- Page-Klasse
- PageSection-Klasse
- Polygon-Klasse
- PolygonConverter-Klasse
- Metadatenklasse
- WordGroup-Klasse
- Word-Klasse
- ProcessingSource-Enumeration
- ResultsTableCell-Klasse
- ResultsTableValue-Klasse
- ResultsTableColumnInfo-Klasse
- ResultsTable-Klasse
- Rotation-Enumeration
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- SectionType-Enumeration
- WordGroupType-Enumeration
- IDocumentTextProjection-Schnittstelle
- ClassificationResult-Klasse
- ExtractionResult-Klasse
- ResultsDocument-Klasse
- ResultsDocumentBounds-Klasse
- ResultsDataPoint-Klasse
- ResultsValue-Klasse
- ResultsContentReference-Klasse
- ResultsValueTokens-Klasse
- ResultsDerivedField-Klasse
- ResultsDataSource-Enumeration
- ResultConstants-Klasse
- SimpleFieldValue-Klasse
- TableFieldValue-Klasse
- DocumentGroup-Klasse
- DocumentTaxonomy-Klasse
- DocumentType-Klasse
- Field-Klasse
- FieldType-Enumeration
- FieldValueDetails Class
- LanguageInfo-Klasse
- MetadataEntry-Klasse
- TextType-Aufzählung
- TypeField-Klasse
- ITrackingActivity-Schnittstelle
- ITrainableActivity-Schnittstelle
- ITrainableClassifierActivity-Schnittstelle
- ITrainableExtractorActivity-Schnittstelle
- TrainableClassifierAsyncCodeActivity-Klasse
- TrainableClassifierCodeActivity-Klasse
- TrainableClassifierNativeActivity-Klasse
- TrainableExtractorAsyncCodeActivity-Klasse
- TrainableExtractorCodeActivity-Klasse
- TrainableExtractorNativeActivity-Klasse
- BasicDataPoint-Klasse – Vorschau
- ExtractionResultHandler-Klasse – Vorschau
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Versionshinweise
- Über das Document Understanding-Aktivitätspaket
- Projektkompatibilität
- Konfigurieren einer externen Verbindung
- PDF-Passwort festlegen
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- PDF-Seitenbereich extrahieren
- Extract Document Data
- Validierungsaufgabe erstellen und warten
- Wait for Validation Task and Resume
- Create Validation Task
- Dokument klassifizieren (Classify Document)
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Wait For Classification Validation Task And Resume
- IntelligentOCR
- Versionshinweise
- Über das IntelligentOCR-Aktivitätspaket
- Projektkompatibilität
- Taxonomie laden (Load Taxonomy)
- Digitalisieren von Dokumenten
- Dokumentbereich klassifizieren (Classify Document Scope)
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Document Understanding-Projektklassifizierer
- Intelligenter Schlüsselwortklassifizierer
- Create Document Validation Action
- Create Document Validation Artifacts
- Artefakte der Dokumentvalidierung abrufen
- Wait For Document Classification Action And Resume
- Klassifizierer-Scope trainieren
- Keyword Based Classifier Trainer
- Intelligent Keyword Classifier Trainer
- Datenextraktionsumfang
- Document Understanding-Projektextraktor
- Document Understanding Project Extractor Trainer
- Regex Based Extractor
- Form Extractor
- Extraktor für intelligente Formulare
- Dokument zensieren
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Train Extractors Scope
- Extraktionsergebnisse exportieren
- Machine Learning Extractor
- Machine Learning Extractor Trainer
- Machine Learning Classifier
- Machine Learning Classifier Trainer
- Generativer Klassifizierer
- Generativer Extraktor
- Konfigurieren der Authentifizierung
- ML-Services
- OCR
- OCR-Verträge
- Versionshinweise
- Über die OCR-Verträge
- Projektkompatibilität
- IOCRActivity-Schnittstelle
- OCRAsyncCodeActivity-Klasse
- OCRCodeActivity-Klasse
- OCRNativeActivity-Klasse
- Character-Klasse
- OCRResult-Klasse
- Word-Klasse
- FontStyles-Enumeration
- OCRRotation-Enumeration
- OCRCapabilities-Klasse
- OCRScrapeBase-Klasse
- OCRScrapeFactory-Klasse
- ScrapeControlBase-Klasse
- ScrapeEngineUsages-Enumeration
- ScrapeEngineBase
- ScrapeEngineFactory-Klasse
- ScrapeEngineProvider-Klasse
- OmniPage
- PDF
- [Nicht aufgeführt] Abbyy
- Versionshinweise
- Über das Abbyy-Aktivitätspaket
- Projektkompatibilität
- Abbyy OCR
- Abbyy Cloud OCR
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Dokument klassifizieren (Classify Document)
- Dokument verarbeiten (Process Document)
- Dokument validieren (Validate Document)
- Dokument exportieren (Export Document)
- Feld erhalten (Get Field)
- Tabelle erhalten (Get Table)
- Vorbereiten der Validierungsstationsdaten
- [Nicht aufgeführt] Abbyy Embedded

Document Understanding-Aktivitäten
Über das IntelligentOCR-Aktivitätspaket
UiPath.IntelligentOCR.Activities enthält die Infrastruktur zur Aktivierung von Dokumentverarbeitungsabläufen mit einem vollständigen, offenen und erweiterbaren Ansatz.
Bei der Installation des UiPath.IntelligentOCR.Activities -Pakets wird das UiPath.DocumentUnderstanding.ML.Activities -Paket automatisch installiert, um die ML-basierte Klassifizierung und Extraktion durchzuführen.
Bekannte Einschränkung
Wenn Sie Aktivitäten vom Typ „Wait for“ verwenden, die Workflows anhalten, und Sie mit DataTable -Variablen arbeiten, ist es wichtig, dass DataTable -Variablen serialisierbar sind. Wenn eine DataTable -Variable beispielsweise mit new System.Data.DataTable initialisiert wird, wird sie nicht mehr serialisierbar, und dies kann dazu führen, dass Ihre Projektausführung fehlschlägt. Um dies zu verhindern, können Sie entweder: den Standardwert der DataTable -Variablen leer lassen oder der DataTable -Variablen einen Namen zuweisen, z. B. new System.Data.DataTable("MyTable").
Ersetzen entfernter Versionen
Die folgende Tabelle zeigt die entfernten Paketversionen und die empfohlene Version, die stattdessen verwendet werden soll.
Tabelle 1. Die entfernten Versionen und ihr empfohlener Ersatz
| Empfohlene Version | |
|---|---|
| 4.3.0-Vorschau | 4.4.0-Vorschau |
| 2.1.0 | 2.2.0 |
| 1.4.0 | 1.5.0 |
| 1.2.0 | 1.2.1 |
Wichtig
- Ab Release v6.19.0 wird bei der Installation des UiPath.IntelligentOCR.Activities -Pakets in einem Projekt automatisch auch das UiPath.DocumentUnderstanding.ML.Activities -Paket installiert und Sie müssen es nicht separat installieren.
- Wenn Sie UiPath® Studio 2023.4.4 oder früher verwenden, stellen Sie sicher, dass Sie die neueste Version von Windows .NET 6.0 Desktop Runtime installieren.
Versionskompatibilität
Wenn UiPath.IntelligentOCR.Activities aktualisiert wird, müssen auch die Pakete UiPath.UIAutomation.Activities und UiPath.OCR.Activities aktualisiert werden, sofern im Projekt enthalten.
UiPath.IntelligentOCR.Activities und UiPath.DocumentUnderstanding.Activities dürfen nicht zusammen im selben Projekt verwendet werden. Das UiPath.IntelligentOCR.Activities -Paket sollte für Windows-Workflows (oder Legacy-Workflows verwendet werden, während das UiPath.DocumentUnderstanding.Activities -Paket für plattformübergreifende Workflows verwendet werden sollte.
Bevor Sie die Funktion Überwachen verwenden, beachten Sie Folgendes:
- Nur UiPath.DocumentUnderstanding.Activities v 2.7.0 oder neuere Versionen unterstützen Monitor;
- Nur IntelligentOCR.Activities v6.20 oder neuere Versionen enthalten die Aktivität Document Understanding Project Extractor, die Monitor unterstützt
Unterstützte Formate
Das Aktivitätspaket IntelligentOCR kann einen der folgenden Dateitypen unterstützen: .png, .gif, .jpe, .jpg, .jpeg, .tiff, .tif, .bmp, und .pdf.
Unterstützung für die Projektsprache C#
Ab Version 4.10.0, Dieses Aktivitätspaket ist für die Verwendung in C#-Projekten validiert.
Funktionen
Dieser Abschnitt zeigt die verschiedenen Funktionalitäten des Pakets Intelligent.OCR.
Digitalisieren von Dokumenten
Sie können dies mit der Aktivität Digitize Document erreichen. Dadurch wird der Text aus jeder PDF-Datei oder jedem Bild abgerufen, wobei nur bei Bedarf das OCR-Modul Ihrer Wahl verwendet wird.
Während die Dokumente nacheinander verarbeitet werden, durchlaufen sie den Digitalisierungsprozess. Der Unterschied bei nicht digitalen (gescannten) Dokumenten besteht darin, dass Sie das OCR-Modul Ihrer Wahl anwenden müssen. Die Ausgaben dieses Schritts sind das Document Object Model und eine String-Variable, die den gesamten Dokumenttext enthält und an die nächsten Schritte übergeben wird.
Dokumente klassifizieren
Sie können dies mit der Aktivität Classify Document erreichen. Dadurch kann mithilfe eines beliebigen Klassifizierungsalgorithmus ermittelt werden, um welchen Dokumenttyp es sich bei einer Datei handelt.
Nach der Digitalisierung wird das Dokument klassifiziert. Wenn Sie mit mehreren Dokumenttypen im selben Projekt arbeiten, müssen Sie zum ordnungsgemäßen Extrahieren von Daten wissen, mit welchem Dokumenttyp Sie arbeiten. Wichtig ist, dass Sie mehrere Klassifizierer im selben Scope verwenden, die Klassifizierer konfigurieren und später im Framework trainieren können. Die Klassifizierungsergebnisse helfen bei der Anwendung der richtigen Strategie bei der Extraktion.
Die folgende Liste zeigt die verfügbaren Klassifizierer:
- Die Aktivität Keyword Based Classifier ist der erste Klassifizierer dieser Art, der auf die Klassifizierung von Dokumenten mit Titeln abzielt.
- Die Aktivität Intelligent Keyword Classifier kann Dateien, die mehrere Dokumenttypen enthalten, nicht nur klassifizieren, sondern auch „aufteilen“.
- Die Aktivität Machine Learning Classifier kann Ihre Dateien mithilfe eines leistungsstarken ML-Modells klassifizieren, das Sie entsprechend Ihren Anforderungen trainieren können.
- Mit der Aktivität Generative Classifier können Sie Dokumente mithilfe von generativen Modellen klassifizieren.
Automatische Klassifizierung validieren
Dies ist mit der Attended-Aktivität Present Classification Station möglich, die eine für die Dokumentverarbeitung spezifische Benutzeroberfläche zum Validieren und Korrigieren von automatischen Klassifizierungsausgaben bereitstellt.
Insbesondere für Anwendungsfälle, bei denen eine Dateiaufteilung involviert ist, wird dringend empfohlen, den Validierungsschritt der menschlichen Klassifizierung zu verwenden, um sicherzustellen, dass die nachgelagerte Verarbeitung für die Datenextraktion ordnungsgemäß funktioniert.
Eine Alternative zur Attended-Aktivität ist die Verwendung von Workflows mit langer Ausführungszeit, die die Zusammenarbeit zwischen Mensch und Roboter optimal ermöglichen. Die Aktivitäten Create Document Classification Action und Wait For Document Classification Action And Resume ermöglichen dieses Szenario.
Klassifizierer trainieren
Dies ist mit der Aktivität Train Classifiers Scope möglich. Dies ermöglicht das Schließen der Feedback-Schleife für jeden lernfähigen Klassifizierungsalgorithmus. Ziehen Sie Ihre Klassifizierertrainer in diese Scope-Aktivität und aktivieren Sie sie mit dem Assistenten Klassifizierer konfigurieren, um sicherzustellen, dass die Informationen, die von Menschen über die Classification Station oder Validation Station validiert wurden, von Ihren Klassifizierern verwendet werden, um ihre eigene Leistung zu verbessern.
Die Klassifizierung ist so effizient wie die verwendeten Klassifizierer. Wenn ein Dokument nicht ordnungsgemäß klassifiziert wurde, war es den aktiven Klassifizierern unbekannt. Das Framework bietet die Möglichkeit, die Klassifizierer zu trainieren, um die Erkennung der Dokumentklassen zu verbessern.
Im Folgenden finden Sie eine Liste der verfügbaren Klassifizierertrainer:
- Der Keyword Based Classifier Trainer ist die Traineraktivität, die mit dem Keyword Based Classifier gekoppelt ist.
- Der Intelligent Keyword Classifier Trainer aktiviert die Feedback-Schleife für den Intelligent Keyword Classifier.
- Der Machine Learning Classifier Trainer ist die Traineraktivität, die mit dem Machine Learning Classifier gekoppelt ist.
Extrahieren von Daten aus Dokumenten
Sie können dies mit der Aktivität Data Extraction Scope erreichen. Dies ermöglicht die Verwendung eines beliebigen Datenextraktionsalgorithmus zur Identifizierung verschiedener Felder in einem klassifizierten Dokument.
Bei der Extraktion werden nur die Daten abgerufen, an denen Sie interessiert sind, aus einem bestimmten Dokumenttyp. Das Extrahieren bestimmter Daten aus einem fünfseitigen Dokument ist beispielsweise ziemlich mühsam, wenn Sie dies mit Zeichenfolgenmanipulation tun möchten. In diesem Framework können Sie verschiedene Extraktoren für die verschiedenen Dokumentstrukturen im selben Datenextraktionsumfang verwenden. Die Extraktionsergebnisse werden zur Validierung weitergereicht.
Im Folgenden finden Sie eine Liste der verfügbaren Extraktoren:
- Der RegEx Based Extractor ist ein Basisdatenextraktor, der den Abgleich regulärer Ausdrücke anwendet, um die besten Kandidaten für ein bestimmtes Feld zu ermitteln.
- Der Form Extractor verwendet vordefinierte Vorlagen, um die Verarbeitung strukturierter Dokumente mit fester Form zu ermöglichen.
- Der Machine Learning Extractor nutzt die Leistungsfähigkeit von KI und Machine Learning, um Informationen in strukturierten oder halbstrukturierten Dokumenten zu identifizieren, indem entweder einer der öffentlichen Datenextraktionsdienste von UiPath® verwendet wird oder benutzerdefinierte trainierte Machine Learning-Modelle aufgerufen werden, die Sie erstellen und hosten können AI Center.
- Mit dem generativen Extraktor können Sie Dokumente mithilfe von generativen Modellen extrahieren.
Ergebnisse der automatischen Datenextraktion validieren
Dies ist mit der Attended-Aktivität Present Validation Station möglich, die eine für die Dokumentverarbeitung spezifische Benutzeroberfläche für die Datenvalidierung und -korrektur bietet.
- The extracted data can be validated by a human user through the Validation Station. A best practice is to build logic around the decision of adding or not a human validation step, with rules depending on the specific use case to be implemented. Validation results can then be exported and used in further automation activities.
- Sie können auch die menschliche Validierung durch Workflows mit langer Ausführungszeit aktivieren und so die Zusammenarbeit zwischen Mensch und Roboter optimieren, indem Sie die Aktivitäten Create Document Validation Action und Wait for Document Validation Action and Resume verwenden.
Zugextraktoren
Sie können dies mit der Aktivität Train Extractors Scope erreichen. Dies ermöglicht das Schließen der Feedback-Schleife für jeden lernfähigen Datenextraktionsalgorithmus. Ziehen Sie Ihre Extraktortrainer innerhalb dieser Scope-Aktivität per Drag-and-drop und aktivieren Sie sie mit dem Assistenten Extraktoren konfigurieren , um sicherzustellen, dass die von Menschen über die Validation Station validierten Informationen von Ihren Extraktoren verwendet werden, um ihre eigene Leistung zu verbessern.
Die Extraktion ist ebenso effizient wie die verwendeten Extraktoren. Wenn Feldwerte nicht ordnungsgemäß extrahiert wurden, bedeutet dies, dass sie den aktiven Extraktoren unbekannt waren. Das Framework bietet die Möglichkeit, die Extraktoren zu trainieren, um die Erkennung von Feldwerten zu verbessern.
Der Machine Learning Extractor Trainer schließt die Feedback-Schleife für die ML-basierte Datenextraktion, indem er die Daten sammelt, die für das erneute Training eines im AI Center gehosteten Machine Learning-Modells erforderlich sind. Diese Aktivität ist die begleitende Aktivität der Aktivität Machine Learning Extractor .
Extrahierte Informationen exportieren
Sie können dies mit der Aktivität Export Extraction Results erreichen. Auf diese Weise können Sie die komplexe Struktur extrahierter Daten in ein einfaches DataSet (Sammlung von Datentabellen) exportieren.
Sobald Sie über Ihre validierten Informationen verfügen, können Sie sie so verwenden, wie sie sind, oder sie in einem DataTable-Format speichern, das sehr einfach in eine Excel-Datei konvertiert werden kann.
Das UiPath.IntelligentOCR.Activities -Paket ist mit jeder benutzerdefinierten Klassifizierungs- oder Datenextraktionsaktivität kompatibel, die auf dem öffentlichen UiPath.DocumentProcessing.Contracts -Paket basiert. Es bietet volle Flexibilität. Sie können Ihren eigenen Algorithmus speziell für Ihren Anwendungsfall erstellen und ihn mit jeder Drittanbieterlösung zur Dokumentklassifizierung und Datenextraktion integrieren.
Die folgenden Versionen des Pakets wurden aus dem offiziellen Feed entfernt. Bei Problemen wenden Sie sich bitte an unsere Supportteams.
- Bekannte Einschränkung
- Ersetzen entfernter Versionen
- Wichtig
- Versionskompatibilität
- Unterstützte Formate
- Unterstützung für die Projektsprache C#
- Funktionen
- Digitalisieren von Dokumenten
- Dokumente klassifizieren
- Automatische Klassifizierung validieren
- Klassifizierer trainieren
- Extrahieren von Daten aus Dokumenten
- Ergebnisse der automatischen Datenextraktion validieren
- Zugextraktoren
- Extrahierte Informationen exportieren