- Überblick
- Verträge zur Dokumentverarbeitung
- Versionshinweise
- Über die DocumentProcessing-Verträge
- Box-Klasse
- IPersistedActivity-Schnittstelle
- PrettyBoxConverter-Klasse
- IClassifierActivity-Schnittstelle
- IClassifierCapabilitiesProvider-Schnittstelle
- ClassifierDocumentType-Klasse
- ClassifierResult-Klasse
- ClassifierCodeActivity-Klasse
- ClassifierNativeActivity-Klasse
- ClassifierAsyncCodeActivity-Klasse
- ClassifierDocumentTypeCapability-Klasse
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- ExtractorAsyncCodeActivity-Klasse
- ExtractorCodeActivity-Klasse
- ExtractorDocumentType-Klasse
- ExtractorDocumentTypeCapabilities-Klasse
- ExtractorFieldCapability-Klasse
- ExtractorNativeActivity-Klasse
- ExtractorResult-Klasse
- FieldValue Class
- FieldValueResult Class
- ICapabilitiesProvider-Schnittstelle
- IExtractorActivity-Schnittstelle
- ExtractorPayload-Klasse
- DocumentActionPriority-Enumeration
- DocumentActionData-Klasse
- DocumentActionStatus-Enumeration
- DocumentActionType-Enumeration
- DocumentClassificationActionData-Klasse
- DocumentValidationActionData-Klasse
- UserData-Klasse
- Document-Klasse
- DocumentSplittingResult-Klasse
- DomExtensions-Klasse
- Page-Klasse
- PageSection-Klasse
- Polygon-Klasse
- PolygonConverter-Klasse
- Metadatenklasse
- WordGroup-Klasse
- Word-Klasse
- ProcessingSource-Enumeration
- ResultsTableCell-Klasse
- ResultsTableValue-Klasse
- ResultsTableColumnInfo-Klasse
- ResultsTable-Klasse
- Rotation-Enumeration
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- SectionType-Enumeration
- WordGroupType-Enumeration
- IDocumentTextProjection-Schnittstelle
- ClassificationResult-Klasse
- ExtractionResult-Klasse
- ResultsDocument-Klasse
- ResultsDocumentBounds-Klasse
- ResultsDataPoint-Klasse
- ResultsValue-Klasse
- ResultsContentReference-Klasse
- ResultsValueTokens-Klasse
- ResultsDerivedField-Klasse
- ResultsDataSource-Enumeration
- ResultConstants-Klasse
- SimpleFieldValue-Klasse
- TableFieldValue-Klasse
- DocumentGroup-Klasse
- DocumentTaxonomy-Klasse
- DocumentType-Klasse
- Field-Klasse
- FieldType-Enumeration
- FieldValueDetails Class
- LanguageInfo-Klasse
- MetadataEntry-Klasse
- TextType-Aufzählung
- TypeField-Klasse
- ITrackingActivity-Schnittstelle
- ITrainableActivity-Schnittstelle
- ITrainableClassifierActivity-Schnittstelle
- ITrainableExtractorActivity-Schnittstelle
- TrainableClassifierAsyncCodeActivity-Klasse
- TrainableClassifierCodeActivity-Klasse
- TrainableClassifierNativeActivity-Klasse
- TrainableExtractorAsyncCodeActivity-Klasse
- TrainableExtractorCodeActivity-Klasse
- TrainableExtractorNativeActivity-Klasse
- BasicDataPoint-Klasse – Vorschau
- ExtractionResultHandler-Klasse – Vorschau
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Versionshinweise
- Über das Document Understanding-Aktivitätspaket
- Projektkompatibilität
- Konfigurieren einer externen Verbindung
- PDF-Passwort festlegen
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- PDF-Seitenbereich extrahieren
- Extract Document Data
- Validierungsaufgabe erstellen und warten
- Wait for Validation Task and Resume
- Create Validation Task
- Dokument klassifizieren (Classify Document)
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Wait For Classification Validation Task And Resume
- IntelligentOCR
- Versionshinweise
- Über das IntelligentOCR-Aktivitätspaket
- Projektkompatibilität
- Taxonomie laden (Load Taxonomy)
- Digitalisieren von Dokumenten
- Dokumentbereich klassifizieren (Classify Document Scope)
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Document Understanding-Projektklassifizierer
- Intelligenter Schlüsselwortklassifizierer
- Create Document Validation Action
- Create Document Validation Artifacts
- Artefakte der Dokumentvalidierung abrufen
- Wait For Document Classification Action And Resume
- Klassifizierer-Scope trainieren
- Keyword Based Classifier Trainer
- Intelligent Keyword Classifier Trainer
- Datenextraktionsumfang
- Document Understanding-Projektextraktor
- Document Understanding Project Extractor Trainer
- Regex Based Extractor
- Form Extractor
- Extraktor für intelligente Formulare
- Dokument zensieren
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Train Extractors Scope
- Extraktionsergebnisse exportieren
- Machine Learning Extractor
- Machine Learning Extractor Trainer
- Machine Learning Classifier
- Machine Learning Classifier Trainer
- Generativer Klassifizierer
- Generativer Extraktor
- Konfigurieren der Authentifizierung
- ML-Services
- OCR
- OCR-Verträge
- Versionshinweise
- Über die OCR-Verträge
- Projektkompatibilität
- IOCRActivity-Schnittstelle
- OCRAsyncCodeActivity-Klasse
- OCRCodeActivity-Klasse
- OCRNativeActivity-Klasse
- Character-Klasse
- OCRResult-Klasse
- Word-Klasse
- FontStyles-Enumeration
- OCRRotation-Enumeration
- OCRCapabilities-Klasse
- OCRScrapeBase-Klasse
- OCRScrapeFactory-Klasse
- ScrapeControlBase-Klasse
- ScrapeEngineUsages-Enumeration
- ScrapeEngineBase
- ScrapeEngineFactory-Klasse
- ScrapeEngineProvider-Klasse
- OmniPage
- PDF
- [Nicht aufgeführt] Abbyy
- Versionshinweise
- Über das Abbyy-Aktivitätspaket
- Projektkompatibilität
- Abbyy OCR
- Abbyy Cloud OCR
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Dokument klassifizieren (Classify Document)
- Dokument verarbeiten (Process Document)
- Dokument validieren (Validate Document)
- Dokument exportieren (Export Document)
- Feld erhalten (Get Field)
- Tabelle erhalten (Get Table)
- Vorbereiten der Validierungsstationsdaten
- [Nicht aufgeführt] Abbyy Embedded
Document Understanding-Aktivitäten
UiPath.IntelligentOCR.Activities.Redaction.RedactDocument
Beschreibung
Die Aktivität Redact Document generiert eine zensierte PDF-Datei basierend auf der ursprünglichen Eingabe-PDF (bereitgestellt als Dokumentpfad), den Eingabefeldern Extraktionsergebnis und Zu zensierende Wörter .
Die Aktivität Redact Document verwendet das Dokumentobjektmodell , um auf den Speicherort aller in der PDF-Datei identifizierten Wörter zuzugreifen, während die Felder Extraktionsergebnis und Zu zensierende Wörter als Eingabe für die Daten verwendet werden, die wie folgt zensiert werden sollen:
- Jeder Eintrag im Eingabe-Array Zu zensierende Wörter wird als Zeichenfolge für eine kontinuierliche Suche innerhalb des Dokuments zu Redaktionszwecken betrachtet, bei der die Groß- und Kleinschreibung nicht berücksichtigt wird.
- Extraktionsergebniswerte , die eine Referenz haben, werden basierend auf diesem Referenzwert zensiert ( einschließlich der Auswahl von Kundenbereichen als Referenz für einen Wert). Sowohl reguläre Felder als auch Tabellenzellen werden zensiert.
- Extraktionsergebniswerte , die keinen Verweis enthalten (hinzugefügt ohne Verweis auf ein Feld, in dem Erfordert Referenz auf False festgelegt ist) werden ähnlich wie Einträge im Feld Zu zensierende Wörter betrachtet. Das bedeutet, dass alle Vorkommen dieses spezifischen Texts im Eingabedokument zensiert werden.
Die Aktivität sucht nach Wörtern mithilfe des Dokumentobjektmodells und Fuzzy-Matching ist nicht verfügbar.
Für die Bearbeitung von kritisch vertraulichen Dokumenten wird dringend empfohlen, eine menschliche Validierung der Extraktionsergebnisse durchzuführen und referenzbasierte Werte und Auswahlen zu verwenden. Dadurch wird eine umfassende Überprüfung aller Daten gewährleistet, die geschriftet werden müssen, wodurch die Gefahr von OCR-Fehlern oder Problemen in der Wortreihenfolge, die sich auf die endgültige geschwärzte Ausgabe auswirken, minimiert wird.
Projektkompatibilität
Windows-Legacy | Windows
Konfiguration
Designer-Panel
Eingabe
- Dokumentpfad: Der Pfad zu dem Dokument, das Sie zensieren möchten.
- Dokumentobjektmodell: Das Dokumentobjektmodell für die dokumentierte Eingabe, die von der Aktivität Digitize Document erhalten wurde.
- Extraktionsergebnisse (Optional): Die Extraktionsergebnisse des Datenextraktionsprozesses, gespeichert in einer
ExtractionResult-Variablen. Sie können dies aus der Aktivität Data Extraction Scope abrufen. - Zu zensierende Wörter (Optional): Eine Liste der Zeichenfolgen, die zensiert werden, zusätzlich zu den Daten, die aus dem Eingabefeld „Extraktionsergebnisse“ stammen.
- Ausgabedatei – Der Ausgabedateipfad, unter dem Sie die zensierte PDF-Datei speichern möchten.
Eigenschaften-Panel
Allgemein
- AnzeigeName: Der Anzeigename der Aktivität.
Eingabe
- Dokumentpfad: Der Pfad zu dem Dokument, das Sie zensieren möchten.
- Dokumentobjektmodell: Das Dokumentobjektmodell für die dokumentierte Eingabe, die von der Aktivität Digitize Document erhalten wurde.
- Extraktionsergebnisse (Optional): Die Extraktionsergebnisse des Datenextraktionsprozesses, gespeichert in einer
ExtractionResult-Variablen. Sie können dies aus der Aktivität Data Extraction Scope abrufen. - Zu zensierende Wörter (Optional): Eine Liste der Zeichenfolgen, die zensiert werden, zusätzlich zu den Daten, die aus dem Eingabefeld „Extraktionsergebnisse“ stammen.
- Ausgabedatei – Der Ausgabedateipfad, unter dem Sie die zensierte PDF-Datei speichern möchten.
Sonstiges
- Privat: Bei Auswahl werden die Werte von Variablen und Argumenten nicht mehr auf der Stufe Verbose protokolliert.
Ausgabe
- Ausgabedatei – Die Ausgabedatei, die die zensierten Informationen enthält.
Zensierungseinstellungen
- Rahmenfarbe: Die Farbe des Rahmens, der für die Zensierung verwendet wird.
- Rahmenstärke: Die Dicke des Rahmens, der für die Zensierung verwendet wird.
- Dpi: Der Wert von Punkten pro"
- Füllfarbe: Die für die Zensierung verwendete Füllfarbe.