- Überblick
- Verträge zur Dokumentverarbeitung
- Versionshinweise
- Über die DocumentProcessing-Verträge
- Box-Klasse
- IPersistedActivity-Schnittstelle
- PrettyBoxConverter-Klasse
- IClassifierActivity-Schnittstelle
- IClassifierCapabilitiesProvider-Schnittstelle
- ClassifierDocumentType-Klasse
- ClassifierResult-Klasse
- ClassifierCodeActivity-Klasse
- ClassifierNativeActivity-Klasse
- ClassifierAsyncCodeActivity-Klasse
- ClassifierDocumentTypeCapability-Klasse
- ExtractorAsyncCodeActivity-Klasse
- ExtractorCodeActivity-Klasse
- ExtractorDocumentType-Klasse
- ExtractorDocumentTypeCapabilities-Klasse
- ExtractorFieldCapability-Klasse
- ExtractorNativeActivity-Klasse
- ExtractorResult-Klasse
- ICapabilitiesProvider-Schnittstelle
- IExtractorActivity-Schnittstelle
- ExtractorPayload-Klasse
- DocumentActionPriority-Enumeration
- DocumentActionData-Klasse
- DocumentActionStatus-Enumeration
- DocumentActionType-Enumeration
- DocumentClassificationActionData-Klasse
- DocumentValidationActionData-Klasse
- UserData-Klasse
- Document-Klasse
- DocumentSplittingResult-Klasse
- DomExtensions-Klasse
- Page-Klasse
- PageSection-Klasse
- Polygon-Klasse
- PolygonConverter-Klasse
- Metadatenklasse
- WordGroup-Klasse
- Word-Klasse
- ProcessingSource-Enumeration
- ResultsTableCell-Klasse
- ResultsTableValue-Klasse
- ResultsTableColumnInfo-Klasse
- ResultsTable-Klasse
- Rotation-Enumeration
- SectionType-Enumeration
- WordGroupType-Enumeration
- IDocumentTextProjection-Schnittstelle
- ClassificationResult-Klasse
- ExtractionResult-Klasse
- ResultsDocument-Klasse
- ResultsDocumentBounds-Klasse
- ResultsDataPoint-Klasse
- ResultsValue-Klasse
- ResultsContentReference-Klasse
- ResultsValueTokens-Klasse
- ResultsDerivedField-Klasse
- ResultsDataSource-Enumeration
- ResultConstants-Klasse
- SimpleFieldValue-Klasse
- TableFieldValue-Klasse
- DocumentGroup-Klasse
- DocumentTaxonomy-Klasse
- DocumentType-Klasse
- Field-Klasse
- FieldType-Enumeration
- LanguageInfo-Klasse
- MetadataEntry-Klasse
- TextType-Aufzählung
- TypeField-Klasse
- ITrackingActivity-Schnittstelle
- ITrainableActivity-Schnittstelle
- ITrainableClassifierActivity-Schnittstelle
- ITrainableExtractorActivity-Schnittstelle
- TrainableClassifierAsyncCodeActivity-Klasse
- TrainableClassifierCodeActivity-Klasse
- TrainableClassifierNativeActivity-Klasse
- TrainableExtractorAsyncCodeActivity-Klasse
- TrainableExtractorCodeActivity-Klasse
- TrainableExtractorNativeActivity-Klasse
- Document Understanding Digitizer
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Versionshinweise
- Über das Document Understanding-Aktivitätspaket
- Projektkompatibilität
- PDF-Passwort festlegen
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- PDF-Seitenbereich extrahieren
- Extract Document Data
- Validierungsaufgabe erstellen und warten
- Wait for Validation Task and Resume
- Create Validation Task
- Dokument klassifizieren (Classify Document)
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Wait For Classification Validation Task And Resume
- IntelligentOCR
- Versionshinweise
- Über das IntelligentOCR-Aktivitätspaket
- Projektkompatibilität
- Konfigurieren der Authentifizierung
- Taxonomie laden (Load Taxonomy)
- Digitalisieren von Dokumenten
- Dokumentbereich klassifizieren (Classify Document Scope)
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Document Understanding-Projektklassifizierer
- Intelligenter Schlüsselwortklassifizierer
- Create Document Validation Action
- Wait For Document Classification Action And Resume
- Klassifizierer-Scope trainieren
- Keyword Based Classifier Trainer
- Intelligent Keyword Classifier Trainer
- Datenextraktionsumfang
- Document Understanding-Projektextraktor
- Regex Based Extractor
- Form Extractor
- Extraktor für intelligente Formulare
- Aktuelle Validierungsstation
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Train Extractors Scope
- Extraktionsergebnisse exportieren
- ML-Services
- OCR
- OCR-Verträge
- Versionshinweise
- Über die OCR-Verträge
- Projektkompatibilität
- IOCRActivity-Schnittstelle
- OCRAsyncCodeActivity-Klasse
- OCRCodeActivity-Klasse
- OCRNativeActivity-Klasse
- Character-Klasse
- OCRResult-Klasse
- Word-Klasse
- FontStyles-Enumeration
- OCRRotation-Enumeration
- OCRCapabilities-Klasse
- OCRScrapeBase-Klasse
- OCRScrapeFactory-Klasse
- ScrapeControlBase-Klasse
- ScrapeEngineUsages-Enumeration
- ScrapeEngineBase
- ScrapeEngineFactory-Klasse
- ScrapeEngineProvider-Klasse
- OmniPage
- PDF
- [Nicht aufgeführt] Abbyy
- Versionshinweise
- Über das Abbyy-Aktivitätspaket
- Projektkompatibilität
- Abbyy OCR
- Abbyy Cloud OCR
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Dokument klassifizieren (Classify Document)
- Dokument verarbeiten (Process Document)
- Dokument validieren (Validate Document)
- Dokument exportieren (Export Document)
- Feld erhalten (Get Field)
- Tabelle erhalten (Get Table)
- Vorbereiten der Validierungsstationsdaten
- [Nicht aufgeführt] Abbyy Embedded
Datenextraktionsumfang
UiPath.IntelligentOCR.Activities.DataExtraction.DataExtractionScope
ExtractionResult
-Variablen gespeichert, die alle automatisch extrahierten Daten enthält und als Eingabe für die Aktivität Extraktionsergebnisse exportieren (Export Extraction Results) verwendet werden kann. Diese Aktivität bietet überdies einen Assistenten zum Konfigurieren von Extraktionen, mit dem Sie genau angeben können, welche Felder aus den in der Taxonomie definierten Dokumenttypen Sie genau extrahieren möchten.
Designer-Panel
Eingabe
- Dokumentpfad (DocumentPath) - Der Pfad zu dem Dokument, das Sie validieren möchten. Dieses Feld unterstützt nur Strings und Variablen des Typs String.
Hinweis: Die unterstützten Dateitypen für dieses Eigenschaftsfeld sind
.png
,.gif
,.jpe
,.jpg
,.jpeg
,.tiff
,.tif
,.bmp
und.pdf
. - DokumentText – Der Text des Dokuments, gespeichert in einer String-Variablen. Dieser Wert kann mit der Aktivität Digitize Document abgerufen werden. Weitere Informationen dazu finden Sie unter Digitize Document. Dieses Feld unterstützt nur Strings und
String
-Variablen. - DokumentObjektModell – Das Dokumentobjektmodell, gegen das Sie das Dokument validieren möchten. Dieses Modell ist in einer
Document
-Variablen gespeichert und kann mit der Aktivität Digitize Document abgerufen werden. Weitere Informationen dazu finden Sie unter Digitize Document. Dieses Feld unterstützt nurDocument
-Variablen. - Taxonomie – Die Taxonomie, gegen die das Dokument verarbeitet werden soll, gespeichert in einer
DocumentTaxonomy
-Variablen. Dieses Objekt können Sie durch eine Aktivität Load Taxonomy erhalten. Dieses Feld unterstützt nurDocumentTaxonomy
-Variablen. - Klassifizierungsergebnisse – Die Ergebnisse der Ausführung der Klassifizierungsaktivität, gespeichert in einem
ClassificationResult
-Objekt. Dieses Feld ist optional, wenn Sie stattdessen eine DokumenttypID angeben. Dieses Feld unterstützt nurClassificationResult
-Variablen. - DokumentTypID – Die Dokumenttyp-ID, wie sie im Taxonomiemanager zu finden ist. Dieses Feld ist optional, wenn Sie eine Datei im Feld Klassifizierungsergebnisse angeben. Dieses Feld unterstützt nur Strings und
String
-Variablen.
Ausgabe
- Extraktionsergebnisse – Die Extraktionsergebnisse des Datenextraktionsprozesses, gespeichert in einer
ExtractionResult
-Variablen.Hinweis: Wenn der Seitenbereich für die Datenextraktion angibt, dass nur ein Teil der Originaldatei als Ziel verwendet wird, generiert der Datenextraktionsbereich eine Datei im ProjektordnerTEMP
, die dann an die Extraktoren übergeben wird. Die temporäre Datei enthält nur den Seitenbereich, den Extraktoren für die Dokumentverarbeitung erhalten sollen.
Eigenschaften-Panel
Authentication
Mit den Authentifizierungseigenschaften dieser Aktivität können Sie eine automatische Validierung über lokale Roboter durchführen. Bevor Sie diese Eigenschaften konfigurieren, stellen Sie sicher, dass Sie die auf der Seite Konfigurieren der Authentifizierung genannten Voraussetzungen erfüllt haben. Nachdem diese Schritte abgeschlossen sind, können Sie die Authentifizierungseigenschaften der Aktivität ausfüllen.
- Runtime-Anmeldeinformationen-Asset – Verwenden Sie dieses Feld, wenn Sie auf die automatischen Validierungsfunktionen von Document Understanding zugreifen müssen, während der Roboter mit einem lokalen Orchestrator oder von einem anderen Mandanten aus verbunden ist. Sie können ein Anmeldeinformationen-Asset zu Authentifizierungszwecken auf eine der folgenden Arten eingeben:
- Wählen Sie in der Dropdownliste das gewünschte Anmeldeinformations-Asset vom Orchestrator aus, mit dem der UiPath®- Roboter verbunden ist.
- Geben Sie den Pfad zum Orchestrator-Anmeldeinformationen-Asset, in dem Sie die Anmeldeinformationen der externen Anwendung für den Zugriff auf die automatischen Validierungsfunktionen speichern, manuell ein.
Das Format des Pfads sollte
<OrchestratorFolderName>/<AssetName>
sein.
- Runtime-Mandanten-URL – Verwenden Sie dieses Feld neben dem Feld Runtime-Anmeldeinformationen-Asset. Geben Sie die URL des Mandanten ein, mit dem sich der Roboter verbindet, um die automatische Validierung auszuführen. Die URL muss das folgende Format haben:
https://<baseURL>/<OrganizationName>/<TenantName>
.
Allgemein
- AnzeigeName (DisplayName) - Der Anzeigename der Aktivität.
Eingabe
- AutoValidierungAnwenden – Passen Sie die Konfidenz mithilfe der Gegenprüfung der generativen Extraktion an. Die Konfidenzen für gemeldete Werte, die durch generative AI bestätigt werden, wird auf 99 % erhöht. Die Aktivierung dieser Funktion führt zu einem zusätzlichen Verbrauch von AI Units.
Wichtig:
Diese Funktion ist derzeit Teil eines Prüfungsprozesses und gilt erst nach Abschluss der Überprüfung als Teil der FedRAMP-Autorisierung. Hier finden Sie die vollständige Liste der Funktionen, die derzeit überprüft werden.
- Klassifizierungsergebnisse – Die Ergebnisse der Ausführung der Klassifizierungsaktivität, gespeichert in einem
ClassificationResult
-Objekt. Dieses Feld ist optional, wenn Sie stattdessen eine DokumenttypID angeben. Dieses Feld unterstützt nurClassificationResult
-Variablen. - DokumentObjektModell – Das Dokumentobjektmodell, gegen das Sie das Dokument validieren möchten. Dieses Modell ist in einer
Document
-Variablen gespeichert und kann mit der Aktivität Digitize Document abgerufen werden. Weitere Informationen dazu finden Sie unter Digitize Document. Dieses Feld unterstützt nurDocument
-Variablen. - Dokumentpfad (DocumentPath) - Der Pfad zu dem Dokument, das Sie validieren möchten. Dieses Feld unterstützt nur Strings und Variablen des Typs String.
Hinweis: Die unterstützten Dateitypen für dieses Eigenschaftsfeld sind
.png
,.gif
,.jpe
,.jpg
,.jpeg
,.tiff
,.tif
,.bmp
und.pdf
. - DokumentText – Der Text des Dokuments, gespeichert in einer String-Variablen. Dieser Wert kann mit der Aktivität Digitize Document abgerufen werden. Weitere Informationen dazu finden Sie unter Digitize Document. Dieses Feld unterstützt nur Strings und
String
-Variablen. - DokumentTypID – Die Dokumenttyp-ID, wie sie im Taxonomiemanager zu finden ist. Dieses Feld ist optional, wenn Sie eine Datei im Feld Klassifizierungsergebnisse angeben. Dieses Feld unterstützt nur Strings und
String
-Variablen. - FormatWerteWennMöglich – Gibt an, dass ein Wert, der abgeleitete Teile gemeldet hat, nicht vom Datenextraktionsbereich überschrieben wird. Wenn er aber keine abgeleiteten Teile hat, versucht der Datenextraktionsbereich, sie zu berechnen. Wenn die Option auf False festgelegt ist, werden die Werte nicht formatiert.
- AutoValidationConfidenceThreshold - Konfidenz-Schwellenwert für die generative Validierung. Nur Feldwerte mit Konfidenz unter diesem Schwellenwert werden validiert. Wenn Werte bestätigt werden, wird die Konfidenz dieser Werte auf diesen Schwellenwert festgelegt.
Wichtig:
Diese Funktion ist derzeit Teil eines Prüfungsprozesses und gilt erst nach Abschluss der Überprüfung als Teil der FedRAMP-Autorisierung. Hier finden Sie die vollständige Liste der Funktionen, die derzeit überprüft werden.
- Taxonomie – Die Taxonomie, gegen die das Dokument verarbeitet werden soll, gespeichert in einer
DocumentTaxonomy
-Variablen. Dieses Objekt können Sie durch eine Aktivität Load Taxonomy erhalten. Dieses Feld unterstützt nurDocumentTaxonomy
-Variablen.
Sonstiges
- Privat (Private) - Bei Auswahl werden die Werte von Variablen und Argumenten nicht mehr auf der Stufe Verbose protokolliert.
Ausgabe
- Extraktionsergebnisse – Die Extraktionsergebnisse des Datenextraktionsprozesses, gespeichert in einer
ExtractionResult
-Variablen.Hinweis: Wenn der Seitenbereich für die Datenextraktion angibt, dass nur ein Teil der Originaldatei als Ziel verwendet wird, generiert der Datenextraktionsbereich eine Datei im ProjektordnerTEMP
, die dann an die Extraktoren übergeben wird. Die temporäre Datei enthält nur den Seitenbereich, den Extraktoren für die Dokumentverarbeitung erhalten sollen.
Mit dem Assistenten Extraktoren konfigurieren, auf den Sie über Data Extraction Scope zugreifen können, können Sie auswählen, welche Extraktoren auf jeden Dokumenttyp und jedes Feld angewendet werden.
Wählen Sie im Hauptteil der Aktivität Extraktoren konfigurieren aus. Die Schaltfläche für den Assistenten wird verfügbar, nachdem Sie mindestens eine Extraktoraktivität in den Hauptteil der Aktivität Data Extraction Scope gezogen haben. Dieser Assistent zeigt alle in der Taxonomie definierten Dokumenttypen und ihre jeweiligen Felder an und ermöglicht Ihnen, auszuwählen, welchen Extraktor Sie jeweils verwenden möchten.
Jeder Dokumenttyp kann erweitert werden und seine Felder können im Assistenten angezeigt und zum Extrahieren ausgewählt werden.
R2D2
geben und dann dasselbe Alias für einen Machine Learning Extractor Trainer verwenden. Dadurch wird eine Verbindung zwischen dem Extraktor und dem Trainer erstellt. Es dient für Trainingszwecke für den Extraktor. Jeder Extraktor hat ein eindeutiges Alias, während mehrere Trainer dasselbe Alias haben können.
Wählen Sie für die Extraktoren, die diese Funktionalität unterstützen, Extraktor-Funktionen abrufen oder aktualisieren aus. So können Sie Ihre Taxonomiefelder einfach den verfügbaren Extraktorfeldern zuordnen oder sie aktualisieren, falls sich die Extraktorfelder geändert haben.
Wenn die Kontrollkästchen neben jedem Feld in einer beliebigen Spalte aktiviert sind, wird bewirkt, dass der Data Extractor Scope dieses bestimmte Feld vom Extraktor anfordert. Wenn das Kontrollkästchen deaktiviert ist, fordert Data Extractor Scope keinen Wert für dieses Feld vom Extraktor an.
Texteingaben neben jedem Feld ermöglichen Ihnen, in Ihrer Taxonomie definierte Felder etwaigen in der internen Taxonomie der Extraktion definierten Feldern zuzuordnen. Fügen Sie bei regulären Feldern in der Texteingabe den Bezeichner des Zielfelds aus der internen Taxonomie des Extraktors hinzu. Bei Tabellenfeldern wird das übergeordnete Tabellenfeld auf Tabellenebene zugeordnet und die entsprechenden Spalten werden einzeln zugeordnet.
Die Anzahl der Spalten im Assistenten hängt von der Anzahl der Extraktoren in der Scope-Aktivität ab. Der Name jeder Spalte wird durch den Anzeigenamen jeder Extraktoraktivität angegeben.
Wenn mehrere Extraktoren in der Aktivität verwendet werden, definiert die Reihenfolge der Extraktoren im Scope ihre Priorität. Betrachten wir zum Beispiel drei Extraktoren. Wenn Extraktor 1 einen akzeptablen Wert (über der Mindestkonfidenz) für ein bestimmtes angefordertes Feld zurückgibt, wird dieses Feld nicht angefordert, wenn Extraktor 2 und Extraktor 3 ausgeführt werden. Wenn Extraktor 1 und Extraktor 2 Werte unterhalb der Mindestkonfidenz für das bestimmte Feld zurückgeben oder überhaupt nichts zurückgeben, werden die Ergebnisse von Extraktor 3 berücksichtigt, sofern sie die Bedingungen für die Konfidenzakzeptanz erfüllen.
Die Aktivität Data Extraction Scope ist Teil der Document Understanding-Lösungen. Weitere Informationen finden Sie im Document Understanding-Leitfaden.