Document Understanding-Aktivitäten

Letzte Aktualisierung 14. Feb. 2025

Dokumentbereich klassifizieren (Classify Document Scope)

UiPath.IntelligentOCR.Activities.DocumentClassification.ClassifyDocumentScope

Beschreibung

Stellt einen Bereich für Klassifizierungsaktivitäten zur Verfügung, der alle erforderlichen Dateien zum Durchführen der Dokumentklassifizierung enthält. Akzeptiert mindestens einen Classifier und Unterbrechungszeichen dazwischen und gewährleistet, dass alle Parameter an die untergeordneten Klassifizierungsaktivitäten weitergeleitet werden.

Projektkompatibilität

Windows-Legacy | Windows

Konfiguration

Eigenschaften-Panel

Allgemein

AnzeigeName (DisplayName) - Der Anzeigename der Aktivität.

Eingabe

Dokumentobjektmodell (DocumentObjectModel ) – Das Dokumentobjektmodell (DOM), gegen das Sie das Dokument validieren möchten. Dieses Modell ist in einer Document -Variablen gespeichert und kann mit der Aktivität Digitize Document abgerufen werden. Unter Digitize Document erfahren Sie, wie Sie die Aktivität verwenden. Dieses Feld unterstützt nur Document -Variablen.
Dokumentpfad (DocumentPath) - Der Pfad zu dem Dokument, das Sie validieren möchten. Dieses Feld unterstützt nur Strings und String-Variablen.
Hinweis: Die unterstützten Dateitypen für dieses Eigenschaftsfeld sind .png, .gif, .jpe, .jpg, .jpeg, .tiff, .tif, .bmp und .pdf.
Dokumenttext – Der Text des Dokuments, gespeichert in einer String -Variablen. Sie können diesen Wert mit der Aktivität Dokument digitalisieren ( Digitize Document ) abrufen. Unter Digitize Document erfahren Sie, wie Sie diese Aktivität verwenden. Dieses Feld unterstützt nur Strings und String -Variablen.
Taxonomie (Taxonomy) - Die Taxonomie, gegen die das Dokument verarbeitet werden soll, gespeichert in einer DocumentTaxonomy-Variablen. Dieses Feld unterstützt nur DocumentTaxonomy-Variablen.

Sonstiges

Privat (Private) - Bei Auswahl werden die Werte von Variablen und Argumenten nicht mehr auf der Stufe Verbose protokolliert.

Ausgabe

Klassifizierungsergebnisse (ClassificationResults) - Die Ergebnisse der Ausführung der Klassifizierungsdateien, gespeichert in einem IReadOnlyList<ClassificationResult>-Objekt. Dieses Feld unterstützt nur IReadOnlyList<ClassificationResult>-Variablen.

Das Objekt ClassificationResult enthält die folgenden Informationen:

Dokumenttyp-ID (DocumentTypeId) - Die ID, die dem Dokumenttyp entspricht, der mit der Taxonomie übereinstimmt.
Dokument-ID (DocumentId) - Der Dateiname des bearbeiteten Dokuments.
Inhaltstyp (ContentType) - Der im bearbeiteten Dokument enthaltene Inhaltstyp.
Konfidenz ( Confidence ) - Klassifizierungskonfidenz, angezeigt als numerischer Wert zwischen 0 und 1.
OCR-Konfidenz ( OcrConfidence) - OCR-Konfidenz der Zeichen, die Teil der angegebenen Referenz sind, angezeigt als numerischer Wert zwischen 0 und 1.
Referenz (Reference) - Nachweis der Klassifizierung, sowohl in der Textversion des Dokuments (durch TextStartIndex und TextLength), und im Dokumentobjektmodell (Document Object Model) (durch Tokens und die hervorgehobenen Felder für jede Seite, aus welcher der Nachweis ausgewählt wird).
Dokumentgrenzen (DocumentBounds) - Informationen darüber, zu welchem Teil des Dokuments die Klassifizierung gehört, mit StartPage (Int32, 0-basiert), PageCount (Int32), TextStartIndex (Int32, 0-basiert), TextLength (Int32).
Classifier-Name (ClassifierName) - Wird automatisch von der Aktivität Dokumentbereich klassifizieren (Classify Document Scope) mit dem Anzeigenamen des Classifiers befüllt, der das aktuelle Klassifizierungsergebnis (ClassificationResult) meldet.

Hinweis: In ClassificationResults sind alle Inhalte in absteigender Reihenfolge nach Konfidenz-Score sortiert. Dies bedeutet, dass der oberste den höchsten Konfidenzwert aufweist.

Verwenden des Assistenten zum Konfigurieren von Klassifizierern

Mit dem Assistenten zum Konfigurieren von Klassifizierern können Sie konfigurieren, wie die Klassifizierer auf die einzelnen Dokumenttypen angewendet werden und welche Ergebnisse akzeptabel sind.

Führen Sie die folgenden Schritte aus, um den Assistenten zu konfigurieren:

Fügen Sie Ihrem Workflow eine Classify Document Scope-Aktivität hinzu.
Fügen Sie eine oder mehrere Klassifiziereraktivitäten innerhalb der Aktivität Classify Document Scope hinzu.
1. Geben Sie Ihren Klassifizierern selbsterklärende Namen.
2. Ordnen Sie die Klassifizierer im Scope von links nach rechts in der Reihenfolge der Akzeptanzpriorität an.
3. Konfigurieren Sie Ihre Klassifizierer, indem Sie Klassifizierer konfigurieren auswählen.
  Sie können nun den Assistentensehen
  Abbildung 1. Übersicht über den Assistenten zum Konfigurieren von Klassifizierern
Aktivieren Sie die Kontrollkästchen für die Klassifizierer- und Dokumenttyppaare, die Sie aktivieren möchten. Es kann in einem der folgenden Szenarien vorkommen, dass ein Dokumenttyp für einen bestimmten Klassifizierer deaktiviert bleibt:
- Der Klassifizierer ist nicht trainiert oder konfiguriert, um den bestimmten Dokumenttyp zu identifizieren
- Der Klassifizierer funktioniert für den spezifischen Dokumenttyp nicht wie erwartet, und wenn solche Ergebnisse vom Klassifizierer zurückgegeben werden, sollten sie ignoriert werden.
Wenn ein Klassifizierer über eine eigene Taxonomie verfügt, verwenden Sie die Textfelder neben jedem Kontrollkästchen, um die richtige Taxonomiezuordnung zwischen den beiden Taxonomien festzulegen. Wenn Beispielsweise Classifier1 so konfiguriert wurde, dass Klasse INV für eine Rechnung zurückgegeben wird, Ihre Projekttaxonomie jedoch einen Dokumenttyp namens „Incoming Invoice“ enthält, dann sollten das Feld für „Incoming Invoice“ und dieser bestimmte Classifier1 die Zeichenfolge INV enthalten.
Legen Sie für jeden Klassifizierer in Classify Document Scope einen Mindestkonfidenz-Schwellenwert von 0 bis 100 fest. Klassifizierungsergebnisse mit einer Konfidenz, die niedriger als dieser Schwellenwert ist, werden nicht in der Ausgabe der Aktivität Classify Document Scope gespeichert.

Tipp: Die meisten Dokumenttypen generieren eine Vorhersage mit einem Konfidenzniveau. Das Festlegen dieser Eigenschaft verhindert falsch positive Ergebnisse, indem nur die Vorhersagen mit einem Konfidenzniveau über dem Schwellenwert berücksichtigt werden. Sie können ein optimales Konfidenzniveau ermitteln, indem Sie verschiedene Dokumente in Ihrem Workflow testen, die Ergebnisse z. B. in einer Excel-Tabelle aufzeichnen und dann analysieren, welcher Schwellenwert am genauesten ist. Wenden Sie den Schwellenwert an, indem Sie die Eigenschaft Mindestkonfidenz in Ihrem aktuellen Scope anpassen.
Wählen Sie Speichern aus, sobald alle Klassifizierer konfiguriert sind.
Abbildung 2. Der Assistent „Klassifizierer konfigurieren“ ist so konfiguriert, dass für jeden Dokumenttyp ein anderer Klassifizierer verwendet wird

Document Understanding-Integration

Die Aktivität Classify Document Scope ist Teil der Document Understanding-Lösungen. Weitere Informationen finden Sie im Document Understanding-Leitfaden.

Auf dieser Seite