- Überblick
- Verträge zur Dokumentverarbeitung
- Versionshinweise
- Über die DocumentProcessing-Verträge
- Box-Klasse
- IPersistedActivity-Schnittstelle
- PrettyBoxConverter-Klasse
- IClassifierActivity-Schnittstelle
- IClassifierCapabilitiesProvider-Schnittstelle
- ClassifierDocumentType-Klasse
- ClassifierResult-Klasse
- ClassifierCodeActivity-Klasse
- ClassifierNativeActivity-Klasse
- ClassifierAsyncCodeActivity-Klasse
- ClassifierDocumentTypeCapability-Klasse
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- ExtractorAsyncCodeActivity-Klasse
- ExtractorCodeActivity-Klasse
- ExtractorDocumentType-Klasse
- ExtractorDocumentTypeCapabilities-Klasse
- ExtractorFieldCapability-Klasse
- ExtractorNativeActivity-Klasse
- ExtractorResult-Klasse
- FieldValue Class
- FieldValueResult Class
- ICapabilitiesProvider-Schnittstelle
- IExtractorActivity-Schnittstelle
- ExtractorPayload-Klasse
- DocumentActionPriority-Enumeration
- DocumentActionData-Klasse
- DocumentActionStatus-Enumeration
- DocumentActionType-Enumeration
- DocumentClassificationActionData-Klasse
- DocumentValidationActionData-Klasse
- UserData-Klasse
- Document-Klasse
- DocumentSplittingResult-Klasse
- DomExtensions-Klasse
- Page-Klasse
- PageSection-Klasse
- Polygon-Klasse
- PolygonConverter-Klasse
- Metadatenklasse
- WordGroup-Klasse
- Word-Klasse
- ProcessingSource-Enumeration
- ResultsTableCell-Klasse
- ResultsTableValue-Klasse
- ResultsTableColumnInfo-Klasse
- ResultsTable-Klasse
- Rotation-Enumeration
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- SectionType-Enumeration
- WordGroupType-Enumeration
- IDocumentTextProjection-Schnittstelle
- ClassificationResult-Klasse
- ExtractionResult-Klasse
- ResultsDocument-Klasse
- ResultsDocumentBounds-Klasse
- ResultsDataPoint-Klasse
- ResultsValue-Klasse
- ResultsContentReference-Klasse
- ResultsValueTokens-Klasse
- ResultsDerivedField-Klasse
- ResultsDataSource-Enumeration
- ResultConstants-Klasse
- SimpleFieldValue-Klasse
- TableFieldValue-Klasse
- DocumentGroup-Klasse
- DocumentTaxonomy-Klasse
- DocumentType-Klasse
- Field-Klasse
- FieldType-Enumeration
- FieldValueDetails Class
- LanguageInfo-Klasse
- MetadataEntry-Klasse
- TextType-Aufzählung
- TypeField-Klasse
- ITrackingActivity-Schnittstelle
- ITrainableActivity-Schnittstelle
- ITrainableClassifierActivity-Schnittstelle
- ITrainableExtractorActivity-Schnittstelle
- TrainableClassifierAsyncCodeActivity-Klasse
- TrainableClassifierCodeActivity-Klasse
- TrainableClassifierNativeActivity-Klasse
- TrainableExtractorAsyncCodeActivity-Klasse
- TrainableExtractorCodeActivity-Klasse
- TrainableExtractorNativeActivity-Klasse
- BasicDataPoint-Klasse – Vorschau
- ExtractionResultHandler-Klasse – Vorschau
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Versionshinweise
- Über das Document Understanding-Aktivitätspaket
- Projektkompatibilität
- Konfigurieren einer externen Verbindung
- PDF-Passwort festlegen
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- PDF-Seitenbereich extrahieren
- Extract Document Data
- Validierungsaufgabe erstellen und warten
- Wait for Validation Task and Resume
- Create Validation Task
- Dokument klassifizieren (Classify Document)
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Wait For Classification Validation Task And Resume
- IntelligentOCR
- Versionshinweise
- Über das IntelligentOCR-Aktivitätspaket
- Projektkompatibilität
- Taxonomie laden (Load Taxonomy)
- Digitalisieren von Dokumenten
- Dokumentbereich klassifizieren (Classify Document Scope)
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Document Understanding-Projektklassifizierer
- Intelligenter Schlüsselwortklassifizierer
- Create Document Validation Action
- Create Document Validation Artifacts
- Artefakte der Dokumentvalidierung abrufen
- Wait For Document Classification Action And Resume
- Klassifizierer-Scope trainieren
- Keyword Based Classifier Trainer
- Intelligent Keyword Classifier Trainer
- Datenextraktionsumfang
- Document Understanding-Projektextraktor
- Document Understanding Project Extractor Trainer
- Regex Based Extractor
- Form Extractor
- Extraktor für intelligente Formulare
- Dokument zensieren
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Train Extractors Scope
- Extraktionsergebnisse exportieren
- Machine Learning Extractor
- Machine Learning Extractor Trainer
- Machine Learning Classifier
- Machine Learning Classifier Trainer
- Generativer Klassifizierer
- Generativer Extraktor
- Konfigurieren der Authentifizierung
- ML-Services
- OCR
- OCR-Verträge
- Versionshinweise
- Über die OCR-Verträge
- Projektkompatibilität
- IOCRActivity-Schnittstelle
- OCRAsyncCodeActivity-Klasse
- OCRCodeActivity-Klasse
- OCRNativeActivity-Klasse
- Character-Klasse
- OCRResult-Klasse
- Word-Klasse
- FontStyles-Enumeration
- OCRRotation-Enumeration
- OCRCapabilities-Klasse
- OCRScrapeBase-Klasse
- OCRScrapeFactory-Klasse
- ScrapeControlBase-Klasse
- ScrapeEngineUsages-Enumeration
- ScrapeEngineBase
- ScrapeEngineFactory-Klasse
- ScrapeEngineProvider-Klasse
- OmniPage
- PDF
- [Nicht aufgeführt] Abbyy
- Versionshinweise
- Über das Abbyy-Aktivitätspaket
- Projektkompatibilität
- Abbyy OCR
- Abbyy Cloud OCR
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Dokument klassifizieren (Classify Document)
- Dokument verarbeiten (Process Document)
- Dokument validieren (Validate Document)
- Dokument exportieren (Export Document)
- Feld erhalten (Get Field)
- Tabelle erhalten (Get Table)
- Vorbereiten der Validierungsstationsdaten
- [Nicht aufgeführt] Abbyy Embedded
Document Understanding-Aktivitäten
UiPath.DocumentUnderstanding.ML.Activities.GenerativeExtractor
Beschreibung
Ermöglicht das Extrahieren von Dokumenten mithilfe von generativen Modellen.
Bewährte Vorgehensweisen für die Verwendung von generativen Eingabeaufforderungen finden Sie auf der Seite Generativer Extraktor – Bewährte Vorgehensweisen .
- Die unterstützten Sprachen für die generativen Modelle sind die gleichen wie die verwendete OCR-Engine. Weitere Informationen finden Sie auf der Seite OCR unterstützte Sprachen .
- Die Aktivität „Generative Extractor“ unterstützt nicht das Extrahieren von Tabellenfeldern, die im Taxonomiemanager definiert sind, oder die Tabellenextraktion. Sie kann jedoch Text aus Dokumenten extrahieren.
Projektkompatibilität
Windows – Legacy | Windows
Konfiguration
Designer-Panel
- Felddetails verwalten – Wählen Sie diese Option aus, um den Assistenten für die Eingabeaufforderung für den generativen Extraktor zu öffnen.
Eigenschaften-Panel
Authentication
Die Authentifizierungseigenschaften dieser Aktivität ermöglichen es Ihnen, sie über lokale Roboter auszuführen. Bevor Sie diese Eigenschaften konfigurieren, stellen Sie sicher, dass Sie die auf der Seite genannten Voraussetzungen erfüllt haben. Nachdem diese Schritte abgeschlossen sind, können Sie mit dem Ausfüllen der Authentifizierungseigenschaften der Aktivität fortfahren.
- Anmeldeinformations-Asset zur Runtime
- Verwenden Sie dieses Feld, wenn Sie auf Funktionen der generativen Extraktion von Document Understanding zugreifen müssen, während der Roboter mit einem lokalen Orchestrator oder von einem anderen Mandanten aus verbunden ist. Sie können ein Anmeldeinformations-Asset zu Authentifizierungszwecken auf eine der folgenden Arten eingeben:
-
Wählen Sie in der Dropdownliste das gewünschte Anmeldeinformations-Asset vom Orchestrator aus, mit dem der UiPath®-Roboter verbunden ist.
-
Geben Sie den Pfad zum Orchestrator-Anmeldeinformations-Asset manuell ein, in dem Sie die Anmeldeinformationen der externen Anwendung für den Zugriff auf die generativen Funktionen speichern.
Das Format des Pfads sollte
<OrchestratorFolderName>/<AssetName>sein.
- Runtime-Mandanten-URL – Verwenden Sie dieses Feld neben dem Feld Runtime-Anmeldeinformationen-Asset . Geben Sie die URL des Mandanten ein, mit dem sich der Roboter verbindet, um die generative Extraktion auszuführen. Die URL muss das folgende Format haben:
https://<baseURL>/<OrganizationName>/<TenantName>.
Allgemein
- AnzeigeName (DisplayName) - Der Anzeigename der Aktivität.
Sonstiges
- Privat (Private) - Bei Auswahl werden die Werte von Variablen und Argumenten nicht mehr auf der Stufe Verbose protokolliert.
Server
- RetryOnFailure - Automatically retries the machine learning model execution, to eliminate transient network errors. If checked, the activity retries the execution.
- Timeout (milliseconds) - Specifies the amount of time (in milliseconds) to wait for a response from the server before an error is thrown. The default value is 100000 milliseconds (100 seconds).
Verwenden des Assistenten für generativen Extraktor
Mit dem Assistenten für die Eingabeaufforderung von generativen Extraktoren können Sie einen bestimmten Dokumenttyp und ein Feld auswählen. Sie können auch einen optionalen Wert auswählen, um die entsprechenden Felddetails weiter anzugeben. Darüber hinaus können Sie mit dem Assistenten jedem Dokumenttyp einen anderen generativen Extraktortyp zuweisen, um die Anpassung an die unterschiedlichen Größen und Layouts Ihrer Dokumente zu ermöglichen.
Die Eingabeaufforderung wird verwendet, um die zu extrahierenden Felder zu identifizieren, die als Schlüssel-Wert-Paare bereitgestellt werden, wobei der Schlüssel den Namen des Felds und der Wert eine Beschreibung des Felds darstellt, die dem Extraktor hilft, den entsprechenden Wert zu identifizieren. Dieselben Felddetails können nicht für verschiedene Felder innerhalb desselben Dokumenttyps verwendet werden.
Abbildung 1. Die Eingabeaufforderung für den generativen Extraktor

Feldbeschreibungen, die im Assistenten für die Eingabeaufforderung des generativen Extraktors eingegeben wurden, werden in die vom generativen Modell verwendete Eingabeaufforderung integriert.
Feldbeschreibungen, die in den Eingabefeldern des Assistenten zum Konfigurieren von Extraktoren eingegeben wurden, werden vom generativen Modell nicht verwendet.
- Wählen Sie einen Dokumenttyp und Felder aus der Liste der definierten Dokumenttypen aus. Die Feldauswahl erfolgt im Assistenten Extraktoren konfigurieren und die Eingabeaufforderung wird im Assistenten zur Eingabe von generativen Extraktoren definiert.
- Optional können Sie pro Dokumenttyp aus drei Typen von generativen Extraktoren wählen. Die generativen Extraktoroptionen sind:
- Extraktor für langes Dokument – einfaches Layout
- Extraktor für komplexes Layout für lange Dokumente
- Extraktor für komplexes Layout für kurzes Dokument
- Fügen Sie einen optionalen Wert hinzu, um die Felddetails zu definieren. Dies kann eine kurze Beschreibung des Dokumenttyps sein. Die maximale Anzahl der zulässigen Zeichen ist 1000.