- Überblick
- Über die Document Understanding-Aktivitäten
- Verträge zur Dokumentverarbeitung
- Versionshinweise
- Über die DocumentProcessing-Verträge
- Box-Klasse
- IPersistedActivity-Schnittstelle
- PrettyBoxConverter-Klasse
- IClassifierActivity-Schnittstelle
- IClassifierCapabilitiesProvider-Schnittstelle
- ClassifierDocumentType-Klasse
- ClassifierResult-Klasse
- ClassifierCodeActivity-Klasse
- ClassifierNativeActivity-Klasse
- ClassifierAsyncCodeActivity-Klasse
- ClassifierDocumentTypeCapability-Klasse
- ExtractorAsyncCodeActivity-Klasse
- ExtractorCodeActivity-Klasse
- ExtractorDocumentType-Klasse
- ExtractorDocumentTypeCapabilities-Klasse
- ExtractorFieldCapability-Klasse
- ExtractorNativeActivity-Klasse
- ExtractorResult-Klasse
- ICapabilitiesProvider-Schnittstelle
- IExtractorActivity-Schnittstelle
- ExtractorPayload-Klasse
- DocumentActionPriority-Enumeration
- DocumentActionData-Klasse
- DocumentActionStatus-Enumeration
- DocumentActionType-Enumeration
- DocumentClassificationActionData-Klasse
- DocumentValidationActionData-Klasse
- UserData-Klasse
- Document-Klasse
- DocumentSplittingResult-Klasse
- DomExtensions-Klasse
- Page-Klasse
- PageSection-Klasse
- Polygon-Klasse
- PolygonConverter-Klasse
- Metadatenklasse
- WordGroup-Klasse
- Word-Klasse
- ProcessingSource-Enumeration
- ResultsTableCell-Klasse
- ResultsTableValue-Klasse
- ResultsTableColumnInfo-Klasse
- ResultsTable-Klasse
- Rotation-Enumeration
- SectionType-Enumeration
- WordGroupType-Enumeration
- IDocumentTextProjection-Schnittstelle
- ClassificationResult-Klasse
- ExtractionResult-Klasse
- ResultsDocument-Klasse
- ResultsDocumentBounds-Klasse
- ResultsDataPoint-Klasse
- ResultsValue-Klasse
- ResultsContentReference-Klasse
- ResultsValueTokens-Klasse
- ResultsDerivedField-Klasse
- ResultsDataSource-Enumeration
- ResultConstants-Klasse
- SimpleFieldValue-Klasse
- TableFieldValue-Klasse
- DocumentGroup-Klasse
- DocumentTaxonomy-Klasse
- DocumentType-Klasse
- Field-Klasse
- FieldType-Enumeration
- LanguageInfo-Klasse
- MetadataEntry-Klasse
- TextType-Aufzählung
- TypeField-Klasse
- ITrackingActivity-Schnittstelle
- ITrainableActivity-Schnittstelle
- ITrainableClassifierActivity-Schnittstelle
- ITrainableExtractorActivity-Schnittstelle
- TrainableClassifierAsyncCodeActivity-Klasse
- TrainableClassifierCodeActivity-Klasse
- TrainableClassifierNativeActivity-Klasse
- TrainableExtractorAsyncCodeActivity-Klasse
- TrainableExtractorCodeActivity-Klasse
- TrainableExtractorNativeActivity-Klasse
- Document Understanding Digitizer
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Versionshinweise
- Über das Document Understanding-Aktivitätspaket
- Projektkompatibilität
- PDF-Passwort festlegen
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- PDF-Seitenbereich extrahieren
- Extract Document Data
- Validierungsaufgabe erstellen und warten
- Wait for Validation Task and Resume
- Create Validation Task
- Dokument klassifizieren (Classify Document)
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Wait For Classification Validation Task And Resume
- IntelligentOCR
- Versionshinweise
- Über das IntelligentOCR-Aktivitätspaket
- Projektkompatibilität
- Konfigurieren der Authentifizierung
- Taxonomie laden (Load Taxonomy)
- Digitalisieren von Dokumenten
- Dokumentbereich klassifizieren (Classify Document Scope)
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Document Understanding-Projektklassifizierer
- Intelligenter Schlüsselwortklassifizierer
- Create Document Validation Action
- Wait For Document Classification Action And Resume
- Klassifizierer-Scope trainieren
- Keyword Based Classifier Trainer
- Intelligent Keyword Classifier Trainer
- Datenextraktionsumfang
- Document Understanding-Projektextraktor
- Regex Based Extractor
- Form Extractor
- Extraktor für intelligente Formulare
- Aktuelle Validierungsstation
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Train Extractors Scope
- Extraktionsergebnisse exportieren
- ML-Services
- OCR
- OCR-Verträge
- Versionshinweise
- Über die OCR-Verträge
- Projektkompatibilität
- IOCRActivity-Schnittstelle
- OCRAsyncCodeActivity-Klasse
- OCRCodeActivity-Klasse
- OCRNativeActivity-Klasse
- Character-Klasse
- OCRResult-Klasse
- Word-Klasse
- FontStyles-Enumeration
- OCRRotation-Enumeration
- OCRCapabilities-Klasse
- OCRScrapeBase-Klasse
- OCRScrapeFactory-Klasse
- ScrapeControlBase-Klasse
- ScrapeEngineUsages-Enumeration
- ScrapeEngineBase
- ScrapeEngineFactory-Klasse
- ScrapeEngineProvider-Klasse
- OmniPage
- PDF
- [Nicht aufgeführt] Abbyy
- Versionshinweise
- Über das Abbyy-Aktivitätspaket
- Projektkompatibilität
- Abbyy OCR
- Abbyy Cloud OCR
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Dokument klassifizieren (Classify Document)
- Dokument verarbeiten (Process Document)
- Dokument validieren (Validate Document)
- Dokument exportieren (Export Document)
- Feld erhalten (Get Field)
- Tabelle erhalten (Get Table)
- Vorbereiten der Validierungsstationsdaten
- [Nicht aufgeführt] Abbyy Embedded
Über die Document Understanding-Aktivitäten
Mit Document Understanding-Aktivitäten können Sie Dokumente verarbeiten, klassifizieren und extrahieren, um sie automatisiert zu interpretieren.
Document Understanding-Aktivitäten sind eine Schlüsselkomponente der Dokumentverarbeitung. Sie ermöglicht eine vollständige Dokumentverarbeitung, indem das System die Bedeutung eines Dokuments interpretieren und Informationen daraus extrahieren kann. Sie können Dokumentklassifizierungs- und Datenextraktionsmethoden verwenden, um Informationen aus mehreren Dokumenten mit unterschiedlichen Strukturen zu extrahieren und zu interpretieren.
Auf hoher Ebene durchlaufen Dokumente die folgenden fünf grundlegenden Schritte:
- Definieren von Dokumenttypen und zu extrahierenden Daten;
- Bereitstellen des Textes und seiner Position;
- Klassifizieren der Dokumente aus der angegebenen Liste;
- Extrahieren der Informationen;
- Bestätigen der extrahierten Daten durch einen Menschen.
Dann können die extrahierten Daten exportiert und konsumiert werden, wie Sie möchten.
Die Document Understanding-Aktivitäten umfassen die folgenden Pakete:
- Document Processing Contracts: Enthält Datenstrukturen und Schnittstellen, die für die Integration in das Document Understanding-Framework verwendet werden sollen.
- Document Understanding Digitizer: Eine Bibliothek, die digitalisierungsbezogene Funktionen enthält.
- Document Understanding ML: Enthält Aktivitäten, die Machine-Learning-Modelle für Document Understanding-Workflows integrieren.
- Document Understanding OCR Local Server: Enthält keine Aktivitäten, aber nach der Installation in einem Projekt können Sie UiPath Document OCR verwenden, das lokal auf der Robotermaschine ausgeführt wird.
- Document Understanding-Prozess: Diese Vorlage bietet standardmäßig Protokollierung, Ausnahmebehandlung, Wiederholungsmechanismen und alle Methoden, die in einem Document Understanding-Workflow verwendet werden sollten.
- Document Understanding: Ermöglicht das Verarbeiten von Dokumenten.
- Intelligent OCR: Enthält die Infrastruktur zur Aktivierung von Workflows zur Dokumentverarbeitung.
- ML-Dienste: Ermöglicht Ihnen das Abrufen und Aufrufen aller für Ihren Mandanten verfügbaren ML-Fähigkeiten sowie das Hochladen von Dateien oder das Erstellen von Beschriftungsaufgaben.
- OCR: Enthält die Aktivitäten UiPath Screen OCR und UiPath Document OCR, welche die internen OCR-Module von UiPath verwenden.
- OCR-Verträge: Enthält die Verträge, die zur Entwicklung neuer OCR-Module erforderlich sind.
- OmniPage: Enthält die Aktivität OmniPage OCR, die mit der OmniPage OCR-Engine Daten aus einem angegebenen UI-Element (User Interface, Benutzeroberfläche) oder Bild extrahiert.
- PDF: Enthält Aktivitäten zum Extrahieren von Daten aus PDF- und XPS-Dateien.
Rufen Sie Aktivitäts- oder API-basierte Grenzwerte auf, um die aktuellen Spezifikationen und Parameter für die optimale Nutzung von modernen Document Understanding-Projekten und Document Understanding-Aktivitäten zu überprüfen.
Aktivitätspaket | Windows – Studio-Legacy-Projekte | Windows Studio-Projekte (modern) | Plattformübergreifende Studio-Projekte |
---|---|---|---|
Document Understanding ML | |||
Document Understanding OCR Local Server | |||
Document Understanding-Aktivitäten | |||
IntelligentOCR | |||
ML-Services | |||
OCR | |||
OCR-Verträge | |||
OmniPage | |||