- Überblick
- Verträge zur Dokumentverarbeitung
- Über die DocumentProcessing-Verträge
- Box-Klasse
- IPersistedActivity-Schnittstelle
- PrettyBoxConverter-Klasse
- IClassifierActivity-Schnittstelle
- IClassifierCapabilitiesProvider-Schnittstelle
- ClassifierDocumentType-Klasse
- ClassifierResult-Klasse
- ClassifierCodeActivity-Klasse
- ClassifierNativeActivity-Klasse
- ClassifierAsyncCodeActivity-Klasse
- ClassifierDocumentTypeCapability-Klasse
- ExtractorAsyncCodeActivity-Klasse
- ExtractorCodeActivity-Klasse
- ExtractorDocumentType-Klasse
- ExtractorDocumentTypeCapabilities-Klasse
- ExtractorFieldCapability-Klasse
- ExtractorNativeActivity-Klasse
- ExtractorResult-Klasse
- ICapabilitiesProvider-Schnittstelle
- IExtractorActivity-Schnittstelle
- ExtractorPayload-Klasse
- DocumentActionPriority-Enumeration
- DocumentActionData-Klasse
- DocumentActionStatus-Enumeration
- DocumentActionType-Enumeration
- DocumentClassificationActionData-Klasse
- DocumentValidationActionData-Klasse
- UserData-Klasse
- Document-Klasse
- DocumentSplittingResult-Klasse
- DomExtensions-Klasse
- Page-Klasse
- PageSection-Klasse
- Polygon-Klasse
- PolygonConverter-Klasse
- Metadatenklasse
- WordGroup-Klasse
- Word-Klasse
- ProcessingSource-Enumeration
- ResultsTableCell-Klasse
- ResultsTableValue-Klasse
- ResultsTableColumnInfo-Klasse
- ResultsTable-Klasse
- Rotation-Enumeration
- SectionType-Enumeration
- WordGroupType-Enumeration
- IDocumentTextProjection-Schnittstelle
- ClassificationResult-Klasse
- ExtractionResult-Klasse
- ResultsDocument-Klasse
- ResultsDocumentBounds-Klasse
- ResultsDataPoint-Klasse
- ResultsValue-Klasse
- ResultsContentReference-Klasse
- ResultsValueTokens-Klasse
- ResultsDerivedField-Klasse
- ResultsDataSource-Enumeration
- ResultConstants-Klasse
- SimpleFieldValue-Klasse
- TableFieldValue-Klasse
- DocumentGroup-Klasse
- DocumentTaxonomy-Klasse
- DocumentType-Klasse
- Field-Klasse
- FieldType-Enumeration
- LanguageInfo-Klasse
- MetadataEntry-Klasse
- TextType-Aufzählung
- TypeField-Klasse
- ITrackingActivity-Schnittstelle
- ITrainableActivity-Schnittstelle
- ITrainableClassifierActivity-Schnittstelle
- ITrainableExtractorActivity-Schnittstelle
- TrainableClassifierAsyncCodeActivity-Klasse
- TrainableClassifierCodeActivity-Klasse
- TrainableClassifierNativeActivity-Klasse
- TrainableExtractorAsyncCodeActivity-Klasse
- TrainableExtractorCodeActivity-Klasse
- TrainableExtractorNativeActivity-Klasse
- Document Understanding Digitizer
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding-Prozess – Studio-Vorlage
- Document Understanding-Aktivitäten
- Über das Document Understanding-Paket
- Projektkompatibilität
- PDF-Passwort festlegen
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- PDF-Seitenbereich extrahieren
- Extract Document Data
- Validierungsaufgabe erstellen und warten
- Wait for Validation Task and Resume
- Create Validation Task
- Dokument klassifizieren (Classify Document)
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Wait For Classification Validation Task And Resume
- IntelligentOCR
- Über das IntelligentOCR-Aktivitätspaket
- Projektkompatibilität
- Taxonomie laden (Load Taxonomy)
- Digitalisieren von Dokumenten
- Dokumentbereich klassifizieren (Classify Document Scope)
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Intelligenter Schlüsselwortklassifizierer
- Present Classification Station
- Create Document Validation Action
- Wait For Document Classification Action And Resume
- Klassifizierer-Scope trainieren
- Keyword Based Classifier Trainer
- Intelligent Keyword Classifier Trainer
- Datenextraktionsumfang
- Regex Based Extractor
- Form Extractor
- Extraktor für intelligente Formulare
- Aktuelle Validierungsstation
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Train Extractors Scope
- Extraktionsergebnisse exportieren
- ML-Services
- OCR
- OCR-Verträge
- Versionshinweise
- Über die OCR-Verträge
- Projektkompatibilität
- IOCRActivity-Schnittstelle
- OCRAsyncCodeActivity-Klasse
- OCRCodeActivity-Klasse
- OCRNativeActivity-Klasse
- Character-Klasse
- OCRResult-Klasse
- Word-Klasse
- FontStyles-Enumeration
- OCRRotation-Enumeration
- OCRCapabilities-Klasse
- OCRScrapeBase-Klasse
- OCRScrapeFactory-Klasse
- ScrapeControlBase-Klasse
- ScrapeEngineUsages-Enumeration
- ScrapeEngineBase
- ScrapeEngineFactory-Klasse
- ScrapeEngineProvider-Klasse
- OmniPage
- PDF
- [Nicht aufgeführt] Abbyy
- Versionshinweise
- Über das Abbyy-Aktivitätspaket
- Projektkompatibilität
- Abbyy OCR
- Abbyy Cloud OCR
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Dokument klassifizieren (Classify Document)
- Dokument verarbeiten (Process Document)
- Dokument validieren (Validate Document)
- Dokument exportieren (Export Document)
- Feld erhalten (Get Field)
- Tabelle erhalten (Get Table)
- Vorbereiten der Validierungsstationsdaten
- [Nicht aufgeführt] Abbyy Embedded
Digitalisieren von Dokumenten
UiPath.IntelligentOCR.Activities.Digitization.DigitizeDocument
Digitalisiert ein Dokument. Dabei werden dessen Dokumentobjektmodell (DOM) und Text extrahiert und in deren entsprechendem Variablentyp gespeichert.
Allgemein
- AnzeigeName (DisplayName) - Der Anzeigename der Aktivität.
Eingabe
- OCRAufPDFAnwenden – Legt fest, ob der OCR-Prozess auf PDF-Dokumente angewendet werden soll oder nicht. Wenn Jafestgelegt ist, wird die OCR auf allen PDF-Seiten des Dokuments angewendet. Wenn Neinfestgelegt ist, wird nur digital eingegebener Text extrahiert. Der Standardwert ist Autound bestimmt, ob das Dokument abhängig vom Eingabedokument den OCR-Algorithmus anwenden muss.
- DegreeOfParalelism – Gibt an, wie viele Seiten (falls vorhanden) parallel analysiert werden sollen. Der Wert
-1
verwendet die „Anzahl der Kerne auf der Maschine – 1“ (d. h., er versucht, so viele Seiten parallel zu verarbeiten, wie die Anzahl der Kerne – Wert 1), während die Angabe eines positiven Werts diese bestimmte Anzahl logischer Prozessoren verwendet . Standardmäßig ist diese Eigenschaft auf-1
festgelegt. - DetectCheckboxes (DetectCheckboxes) – Erkennt die verfügbaren Kontrollkästchen im Dokument während der Digitalisierung. Der Standardwert ist True.
-
Dokumentpfad (DocumentPath) - Der Dateipfad zu dem Dokument, das Sie digitalisieren möchten. Dieses Feld unterstützt nur Strings und Variablen des Typs String.
Hinweis:- Falls ein Dokument, das über genügend Daten verfügt, nicht klassifiziert werden kann, legen Sie die Eigenschaft OCRAufPDFAnwenden in der Aktivität Digitize Document auf Ja fest.
- Die Textextraktion aus PDF-Dateien wurde aktualisiert, was zu einem optimierten Extraktionsprozess führt, bei dem sowohl nativer als auch gescannter Text gleichzeitig abgerufen wird und die OCR nur auf die in der PDF-Datei identifizierten Bilder angewendet wird. Diese Verbesserung ist nur verfügbar, wenn die Option ApplyOCROnPDF auf Auto festgelegt ist.
Hinweis: Die unterstützten Dateitypen für dieses Eigenschaftsfeld sind.png
,.jpe
,.jpg
,.jpeg
,.tiff
,.tif
und.pdf
.
Sonstiges
- Privat (Private) - Bei Auswahl werden die Werte von Variablen und Argumenten nicht mehr auf der Stufe Verbose protokolliert.
Ausgabe
- DocumentObjectModel - Das Document Object Model (DOM) der Datei, gespeichert in einer
Document
-Variablen. Dieses Feld unterstützt nurDocument
-Variablen. -
Dokumenttext (DokumentText) - Der Text, der aus dem angegebenen Dokument extrahiert wurde. Diese Variable kann anschließend in der Aktivität Aktuelle Validierungsstation (Present Validation Station) verwendet werden. Dieses Feld unterstützt nur Variablen vom Typ String.
Hinweis: Ab UiPath.IntelligentOCR.Activities-Paket v6.3.0-preview verfügt die Aktivität „Dokument digitalisieren“ über eine standardmäßige vorausgewählte OCR-Engine, die UiPath Document OCR-Engine.
Beide Ausgabevariablen, gepaart, da sie abhängig sind, können in der Dokumentverarbeitung im gesamten Dokumentverarbeitungs-Framework (Klassifizierung, Datenextraktion, menschliche Validierung usw.) weiter verwendet werden.
Wenn das Paket UiPath.IntelligentOCR.Activities auf v5.1.0 aktualisiert wurde, dann wurde der Parameter ForceApplyOCR durch ApplyOcrOnPDF ersetzt. Hier ist die Kompatibilität zwischen den alten und neuen Parametern:
-
ForceApplyOCR = True wird ersetzt durch ApplyOcrOnPDF = Yes
-
ForceApplyOCR = False wird ersetzt durch ApplyOcrOnPDF = Auto • ForceApplyOCR = Leer wird ersetzt durch ApplyOcrOnPDF = Auto
-
ForceApplyOCR = <benutzerdefinierte Variable> wird ersetzt durch ApplyOcrOnPDF = Auto
Das Dokumentobjektmodell wird in einem hierdokumentierten proprietären Objekt erfasst.
Damit ein Bild erfolgreich digitalisiert/verarbeitet werden kann, müssen seine Breite und Höhe zwischen 50 und 10.000 Pixeln liegen. Jedes Bild unter oder über diesem Bereich wird mit einer Ausnahmemeldung abgelehnt. Ein Bild, das mit den zuvor genannten Abmessungen validiert wurde und eine Gesamtgröße von über 14 MP aufweist, muss auf 14 MP verkleinert werden, während das Seitenverhältnis (Verhältnis Breite/Höhe) beibehalten wird.
Die OCR-Ergebnisse für gescannte Dokumente wurden verbessert, und jetzt werden die besten Ergebnisse erzielt, wenn der Neigungswinkel zwischen +/- 20 Grad gehalten wird.
Hier sehen Sie, wie die Aktivität Digitize Document in einem Beispiel verwendet wird, das mehrere Aktivitäten enthält.
Sie können das Beispiel hier überprüfen und herunterladen.