Document Understanding-Aktivitäten

Letzte Aktualisierung 5. Dez. 2024

Manuelle Validierung für "Digitize Documents"

Im folgenden Beispiel wird erklärt, wie Daten manuell aus einem Bild extrahiert und die Ausgabe in einer separaten Datei dargestellt werden. Dabei werden Aktivitäten wie Digitize Document oder Present Validation Station verwendet. Diese Aktivitäten finden Sie im Paket UiPath.IntelligentOCR.Activities .

Hinweis: Dieser Workflow verwendet eine ältere Version des UiPath.IntelligentOCR.Activities -Pakets.

Steps:

Öffnen Sie Studio und erstellen Sie einen neuen Prozess, der standardmäßig als Main benannt ist.
Hinweis: Stellen Sie sicher, dass Sie alle erforderlichen Dateien (.json -Dateien und alle Bilder) im Projektordner hinzufügen.

Fügen Sie einen Sequence-Container im Workflow-Designer hinzu und erstellen Sie die in der folgenden Tabelle angezeigten Variablen:

Tabelle 1. Zu erstellende Variablen
	Variablentyp	Standardwert
`Text`	String
`DOM`	UiPath.DocumentProcessing.Contracts.Dom.Document
`Data`	UiPath.DocumentProcessing.Contracts.Taxonomy.DocumentTaxonomy
`DocumentTaxonomy`	UiPath.DocumentProcessing.Contracts.Taxonomy.DocumentTaxonomy
`TaxonomyJSON`	String
`HumanValidated`	UiPath.DocumentProcessing.Contracts.Results.ExtractionResult

Fügen Sie eine Read Text File-Aktivität in die Sequence ein.
- Fügen Sie im Eigenschaftenbereich den Namen der Datei, in diesem Fall "taxonomy.json", in das Feld Dateiname ein.
- Fügen Sie die Variable TaxonomyJSON in das Feld Inhalt ein.
Fügen Sie eine Assign-Aktivität nach der Aktivität Read Text File hinzu.
- Fügen Sie die Variable Data im Feld An und den Ausdruck DocumentTaxonomy.Deserialize(TaxonomyJSON) im Feld Wert hinzu. Diese Aktivität erstellt die Taxonomie für die Extraktion.
Fügen Sie nach der Aktivität Assign eine Digitize Document-Aktivität hinzu.
- Fügen Sie im Eigenschaftenbereich den Wert 1 in das Feld Parallelitätsgrad ein.
- Fügen Sie den Ausdruck "Input\Invoice01.tif" in das Feld Dokumentpfad ein.
- Fügen Sie die Variable DOM im Feld DocumentObjectModel hinzu.
- Fügen Sie die Variable Text im Feld Dokumenttext hinzu.
Fügen Sie ein Google OCR-Modul innerhalb der Aktivität Digitize Document hinzu.
- Fügen Sie im Eigenschaftenbereich die Variable Image in das Feld Bild ein.
- Aktivieren Sie das Kontrollkästchen für die Option Wörter extrahieren . Diese Option extrahiert die Position aller erkannten Wörter auf dem Bildschirm.
- Fügen Sie den Ausdruck "eng" in das Feld Sprache ein.
- Wählen Sie in der Dropdownliste Profil die Option Legacy aus.
- Fügen Sie den Wert 2 in das Feld Skalierung ein.
Fügen Sie eine Aktivität Present Validation Station nach der Aktivität Digitize Document hinzu.
- Fügen Sie im Panel Eigenschaften die Variable DOM im Feld DocumentObjectModel hinzu.
- Fügen Sie den Ausdruck "Input\Invoice01.tif" in das Feld Dokumentpfad ein.
- Fügen Sie die Variable Text im Feld Dokumenttext hinzu.
- Fügen Sie die Variable Data im Feld Taxonomie hinzu.
- Fügen Sie die Variable HumanValidated im Feld ValidatedExtractionResults hinzu .
Fügen Sie eine For Each-Aktivität unter der Aktivität Present Validation Station hinzu.
- Wählen Sie im Eigenschaftenbereich die Option UiPath.DocumentProcessing.Contracts.Results.ResultsDataPoint aus der TypeArgument-Dropdownliste aus.
- Fügen Sie den Ausdruck HumanValidated.ResultsDocument.Fields in das Feld Werte ein.
Fügen Sie eine Protokollnachricht- Aktivität im Textkörper der For Each- Aktivität hinzu.
- Wählen Sie in der Dropdownliste Ebene die Option Info aus.
- Fügen Sie den Ausdruck item.FieldName in das Feld Nachricht ein.
Fügen Sie eine Log Message-Aktivität unter der vorherigen Log Message-Aktivität ein.
- Wählen Sie in der Dropdown-Liste Ebene die Option Info aus.
- Fügen Sie den Ausdruck item.Values(0).Value.ToString in das Feld Nachricht ein.
Fügen Sie eine Write Line-Aktivität unterhalb der Log Message-Aktivitäten hinzu.
- Fügen Sie den Wert "" in das Feld Text ein.
Führen Sie den Prozess aus. Der Roboter verwendet die IntelligentOCR-Aktivitäten, um die Daten manuell zu verarbeiten und die Ergebnisse zu präsentieren.