document-understanding
latest
false
- Überblick
- Erste Schritte
- Aktivitäten
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)
- Insights-Dashboards
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- Überblick
- Document Understanding-Aktivitäten
- Übersicht zur Dokumentklassifizierung
- „Klassifizierer konfigurieren“-Assistent von Classify Document Scope
- Intelligenter Schlüsselwortklassifizierer
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Machine Learning Classifier
- Generativer Klassifizierer
- Dokumentklassifizierung – verwandte Aktivitäten
- Datenverbrauch
- API-Aufrufe
- ML-Pakete
- Überblick
- Document Understanding – ML-Paket
- DocumentClassifier – ML-Paket
- ML-Pakete mit OCR-Funktionen
- 1040 – ML-Paket
- 1040 Anlage C – ML-Paket
- 1040 Anlage D – ML-Paket
- 1040 Anlage E – ML-Paket
- 1040x – ML-Paket
- 3949a – ML-Paket
- 4506T – ML-Paket
- 709 – ML-Paket
- 941x – ML-Paket
- 9465 – ML-Paket
- ACORD131 – ML-Paket
- ACORD140 – ML-Paket
- ACORD25 – ML-Paket
- Bank Statements – ML-Paket
- BillsOfLading – ML-Paket
- Certificate of Incorporation – ML-Paket
- Certificates of Origin – ML-Paket
- Checks – ML-Paket
- Children Product Certificate – ML-Paket
- CMS1500 – ML-Paket
- EU Declaration of Conformity – ML-Paket
- Financial Statements – ML-Paket
- FM1003 – ML-Paket
- I9 – ML-Paket
- ID Cards – ML-Paket
- Invoices – ML-Paket
- InvoicesAustralia – ML-Paket
- InvoicesChina – ML-Paket
- Rechnungen Hebräisch – ML-Paket
- InvoicesIndia – ML-Paket
- InvoicesJapan – ML-Paket
- Invoices Shipping – ML-Paket
- Packing Lists – ML-Paket
- Gehaltsabrechnungen (Pay slips) – ML-Paket
- Passports – ML-Paket
- Purchase Orders – ML-Paket
- Receipts – ML-Paket
- RemittanceAdvices – ML-Paket
- UB04 – ML-Paket
- Utility Bills – ML-Paket
- Vehicle Titles – ML-Paket
- W2 – ML-Paket
- W9 – ML-Paket
- Andere out-of-the-box ML-Pakete
- Öffentliche Endpunkte
- Einschränkungen für den Datenverkehr
- OCR-Konfiguration
- Pipelines
- OCR-Dienste
- Unterstützte Sprachen
- Deep Learning
- Lizenzierung
Auswertungspipelines
Document Understanding-Benutzerhandbuch.
Last updated 14. Nov. 2024
Auswertungspipelines
Eine Auswertungspipeline wird für die Auswertung eines trainierten ML-Modells verwendet.
Konfigurieren Sie die Auswertungspipeline wie folgt:
- Wählen Sie im Feld „Pipelinetyp“ die Option „Auswertungsausführung“ aus.
- Wählen Sie im Feld „Hauptversion des Pakets wählen“ eine Hauptversion für Ihr Paket aus.
- Wählen Sie im Feld „Nebenversion des Pakets wählen“ eine Nebenversion aus, die Sie auswerten möchten.
- Wählen Sie im Feld „Auswertungs-Dataset wählen“ ein repräsentatives Auswertungs-Dataset aus. Weitere Informationen zur Dataset-Struktur finden Sie im Abschnitt Dataset-Format.
- Im Abschnitt „Parameter eingeben“ gibt es eine Umgebungsvariable, die für Auswertungspipelines relevant ist, die Sie verwenden könnten:
- Wenn
eval.redo_ocr
auf „true“ gesetzt ist, können Sie OCR bei der Ausführung der Pipeline erneut ausführen, um die Auswirkungen von OCR auf die Extraktionsgenauigkeit zu bewerten. Dies geht davon aus, dass ein OCR-Modul bei der Erstellung des ML-Pakets konfiguriert wurde. - Der Schieberegler „GPU aktivieren“ ist standardmäßig deaktiviert. In diesem Fall wird die Pipeline auf der CPU ausgeführt. Es wird dringend empfohlen, dass Auswertungspipelines nur auf der CPU ausgeführt werden.
-
Wählen Sie eine der Optionen aus, wann die Pipeline ausgeführt werden soll: „Jetzt ausführen“, „Zeitbasiert“ oder „Wiederkehrend“.
- Nachdem Sie alle Felder konfiguriert haben, klicken Sie auf „Erstellen“. Die Pipeline wird erstellt.
Bei einer Auswertungspipeline umfasst der Bereich „Ausgaben“ auch einen Ordner namens „artifacts“/„eval_metrics“, der zwei Dateien enthält:
evaluation_default.xlsx
ist eine Excel-Tabelle mit drei verschiedenen Blättern:- Das erste Blatt zeigt eine Zusammenfassung der Gesamtpunktzahlen und der Punktzahlen pro Batch für jedes Feld – „Regulär“, „Spalte“ und „Klassifizierung“. Ein Prozentsatz der fehlerfrei extrahierten Dokumente wird auch für jedes Batch sowie das Gesamtdokument angegeben.
- Das zweite Blatt zeigt einen Direktvergleich der regulären Felder anhand von Farben zur Erhöhung der Dokumentgenauigkeit. Dabei werden oben die ungenausten Dokumente angezeigt, um die Diagnose und Fehlerbehebung zu erleichtern.
- Das dritte Blatt zeigt einen Vergleich der Spaltenfelder anhand von Farben.
- Alle in der Excel-Datei angezeigten Punktzahlen stellen die Punktzahlen für die Genauigkeit dar.
evaluation_metrics_default.txt
enthält die F1-Punktzahl der vorhergesagten Felder.