- Überblick
- Über die Document Understanding-Aktivitäten
- Verträge zur Dokumentverarbeitung
- Versionshinweise
- Über die DocumentProcessing-Verträge
- Box-Klasse
- IPersistedActivity-Schnittstelle
- PrettyBoxConverter-Klasse
- IClassifierActivity-Schnittstelle
- IClassifierCapabilitiesProvider-Schnittstelle
- ClassifierDocumentType-Klasse
- ClassifierResult-Klasse
- ClassifierCodeActivity-Klasse
- ClassifierNativeActivity-Klasse
- ClassifierAsyncCodeActivity-Klasse
- ClassifierDocumentTypeCapability-Klasse
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- ExtractorAsyncCodeActivity-Klasse
- ExtractorCodeActivity-Klasse
- ExtractorDocumentType-Klasse
- ExtractorDocumentTypeCapabilities-Klasse
- ExtractorFieldCapability-Klasse
- ExtractorNativeActivity-Klasse
- ExtractorResult-Klasse
- FieldValue Class
- FieldValueResult Class
- ICapabilitiesProvider-Schnittstelle
- IExtractorActivity-Schnittstelle
- ExtractorPayload-Klasse
- DocumentActionPriority-Enumeration
- DocumentActionData-Klasse
- DocumentActionStatus-Enumeration
- DocumentActionType-Enumeration
- DocumentClassificationActionData-Klasse
- DocumentValidationActionData-Klasse
- UserData-Klasse
- Document-Klasse
- DocumentSplittingResult-Klasse
- DomExtensions-Klasse
- Page-Klasse
- PageSection-Klasse
- Polygon-Klasse
- PolygonConverter-Klasse
- Metadatenklasse
- WordGroup-Klasse
- Word-Klasse
- ProcessingSource-Enumeration
- ResultsTableCell-Klasse
- ResultsTableValue-Klasse
- ResultsTableColumnInfo-Klasse
- ResultsTable-Klasse
- Rotation-Enumeration
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- SectionType-Enumeration
- WordGroupType-Enumeration
- IDocumentTextProjection-Schnittstelle
- ClassificationResult-Klasse
- ExtractionResult-Klasse
- ResultsDocument-Klasse
- ResultsDocumentBounds-Klasse
- ResultsDataPoint-Klasse
- ResultsValue-Klasse
- ResultsContentReference-Klasse
- ResultsValueTokens-Klasse
- ResultsDerivedField-Klasse
- ResultsDataSource-Enumeration
- ResultConstants-Klasse
- SimpleFieldValue-Klasse
- TableFieldValue-Klasse
- DocumentGroup-Klasse
- DocumentTaxonomy-Klasse
- DocumentType-Klasse
- Field-Klasse
- FieldType-Enumeration
- FieldValueDetails Class
- LanguageInfo-Klasse
- MetadataEntry-Klasse
- TextType-Aufzählung
- TypeField-Klasse
- ITrackingActivity-Schnittstelle
- ITrainableActivity-Schnittstelle
- ITrainableClassifierActivity-Schnittstelle
- ITrainableExtractorActivity-Schnittstelle
- TrainableClassifierAsyncCodeActivity-Klasse
- TrainableClassifierCodeActivity-Klasse
- TrainableClassifierNativeActivity-Klasse
- TrainableExtractorAsyncCodeActivity-Klasse
- TrainableExtractorCodeActivity-Klasse
- TrainableExtractorNativeActivity-Klasse
- BasicDataPoint-Klasse – Vorschau
- ExtractionResultHandler-Klasse – Vorschau
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Versionshinweise
- Über das Document Understanding-Aktivitätspaket
- Projektkompatibilität
- Konfigurieren einer externen Verbindung
- PDF-Passwort festlegen
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- PDF-Seitenbereich extrahieren
- Extract Document Data
- Validierungsaufgabe erstellen und warten
- Wait for Validation Task and Resume
- Create Validation Task
- Dokument klassifizieren (Classify Document)
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Wait For Classification Validation Task And Resume
- IntelligentOCR
- Versionshinweise
- Über das IntelligentOCR-Aktivitätspaket
- Projektkompatibilität
- Taxonomie laden (Load Taxonomy)
- Digitalisieren von Dokumenten
- Dokumentbereich klassifizieren (Classify Document Scope)
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Document Understanding-Projektklassifizierer
- Intelligenter Schlüsselwortklassifizierer
- Create Document Validation Action
- Create Document Validation Artifacts
- Artefakte der Dokumentvalidierung abrufen
- Wait For Document Classification Action And Resume
- Klassifizierer-Scope trainieren
- Keyword Based Classifier Trainer
- Intelligent Keyword Classifier Trainer
- Datenextraktionsumfang
- Document Understanding-Projektextraktor
- Document Understanding Project Extractor Trainer
- Regex Based Extractor
- Form Extractor
- Extraktor für intelligente Formulare
- Dokument zensieren
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Train Extractors Scope
- Extraktionsergebnisse exportieren
- Machine Learning Extractor
- Machine Learning Extractor Trainer
- Machine Learning Classifier
- Machine Learning Classifier Trainer
- Generativer Klassifizierer
- Generativer Extraktor
- Konfigurieren der Authentifizierung
- ML-Services
- OCR
- OCR-Verträge
- Versionshinweise
- Über die OCR-Verträge
- Projektkompatibilität
- IOCRActivity-Schnittstelle
- OCRAsyncCodeActivity-Klasse
- OCRCodeActivity-Klasse
- OCRNativeActivity-Klasse
- Character-Klasse
- OCRResult-Klasse
- Word-Klasse
- FontStyles-Enumeration
- OCRRotation-Enumeration
- OCRCapabilities-Klasse
- OCRScrapeBase-Klasse
- OCRScrapeFactory-Klasse
- ScrapeControlBase-Klasse
- ScrapeEngineUsages-Enumeration
- ScrapeEngineBase
- ScrapeEngineFactory-Klasse
- ScrapeEngineProvider-Klasse
- OmniPage
- PDF
- [Nicht aufgeführt] Abbyy
- Versionshinweise
- Über das Abbyy-Aktivitätspaket
- Projektkompatibilität
- Abbyy OCR
- Abbyy Cloud OCR
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Dokument klassifizieren (Classify Document)
- Dokument verarbeiten (Process Document)
- Dokument validieren (Validate Document)
- Dokument exportieren (Export Document)
- Feld erhalten (Get Field)
- Tabelle erhalten (Get Table)
- Vorbereiten der Validierungsstationsdaten
- [Nicht aufgeführt] Abbyy Embedded

Document Understanding-Aktivitäten
Über die Document Understanding-Aktivitäten
Mit Document Understanding-Aktivitäten können Sie Dokumente verarbeiten, klassifizieren und extrahieren, um sie automatisiert zu interpretieren.
Document Understanding-Aktivitäten sind eine Schlüsselkomponente der Dokumentverarbeitung. Sie ermöglicht eine vollständige Dokumentverarbeitung, indem das System die Bedeutung eines Dokuments interpretieren und Informationen daraus extrahieren kann. Sie können Dokumentklassifizierungs- und Datenextraktionsmethoden verwenden, um Informationen aus mehreren Dokumenten mit unterschiedlichen Strukturen zu extrahieren und zu interpretieren.
Auf hoher Ebene durchlaufen Dokumente die folgenden fünf grundlegenden Schritte:
- Definieren von Dokumenttypen und zu extrahierenden Daten;
- Bereitstellen des Textes und seiner Position;
- Klassifizieren der Dokumente aus der angegebenen Liste;
- Extrahieren der Informationen;
- Bestätigen der extrahierten Daten durch einen Menschen.
Dann können die extrahierten Daten exportiert und konsumiert werden, wie Sie möchten.
Die Document Understanding-Aktivitäten umfassen die folgenden Pakete:
- Document Processing Contracts: Contains data structures and interfaces to be used for integrating with the Document Understanding framework.
- Document Understanding OCR Local Server: Contains no activities, but once installed in a project, it enables you to use UiPath Document OCR running locally on the robot machine.
- Document Understanding Process: A template that provides logging, exception handling, retry mechanisms, and all the methods that should be used in a Document Understanding workflow, out of the box.
- Document Understanding: Allows you to process documents.
- Intelligent OCR: Contains the infrastructure for enabling document processing workflows.
- ML Services: Allows you to retrieve and call all ML Skills available on your tenant, as well as upload files or create labeling tasks.
- OCR: Contains the UiPath Screen OCR and UiPath Document OCR activities which use UiPath's in-house OCR engines.
- OCR Contracts: Contains the contracts needed to develop new OCR engines.
- OmniPage: Contains the OmniPage OCR activity which extracts data from an indicated UI (User Interface) element or image using the OmniPage OCR engine.
- PDF: Contains activities designed to extract data from PDF and XPS files.
Moderne Projekte und Aktivitäten
Visit Activity or API-based limits to check the current specifications and parameters for optimal utilization of Document Understanding modern projects and Document Understanding activities.
Projektkompatibilität
Verwenden Sie die folgende Tabelle, um die Kompatibilität zwischen der Plattform und den Aktivitätspaketen zu identifizieren:
Table 1. Document Understanding activities project compatibility
| Windows – Studio-Legacy-Projekte | Windows Studio-Projekte (modern) | Plattformübergreifende Studio-Projekte | |
|---|---|---|---|
| Document Understanding OCR Local Server | ✅ | ✅ | ✅ |
| Document Understanding-Aktivitäten | ❌ | ✅ | ✅ |
| IntelligentOCR | ✅ | ✅ | ❌ |
| ML-Services | ✅ | ✅ | ❌ |
| OCR | ✅ | ✅ | ❌ |
| OCR-Verträge | ✅ | ✅ | ✅ |
| OmniPage | ✅ | ✅ | ❌ |
| ✅ | ✅ | ❌ |