- Überblick
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- Überblick
- Document Understanding-Aktivitäten
- Übersicht zur Dokumentklassifizierung
- „Klassifizierer konfigurieren“-Assistent von Classify Document Scope
- Intelligenter Schlüsselwortklassifizierer
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Machine Learning Classifier
- Generativer Klassifizierer
- Dokumentklassifizierung – verwandte Aktivitäten
- Datenverbrauch
- API-Aufrufe
- ML-Pakete
- Überblick
- Document Understanding – ML-Paket
- DocumentClassifier – ML-Paket
- ML-Pakete mit OCR-Funktionen
- 1040 – ML-Paket
- 1040 Anlage C – ML-Paket
- 1040 Anlage D – ML-Paket
- 1040 Anlage E – ML-Paket
- 1040x – ML-Paket
- 3949a – ML-Paket
- 4506T – ML-Paket
- 709 – ML-Paket
- 941x – ML-Paket
- 9465 – ML-Paket
- 990 – ML-Paket – Vorschau
- ACORD125 – ML-Paket
- ACORD126 – ML-Paket
- ACORD131 – ML-Paket
- ACORD140 – ML-Paket
- ACORD25 – ML-Paket
- Bank Statements – ML-Paket
- BillsOfLading – ML-Paket
- Certificate of Incorporation – ML-Paket
- Certificates of Origin – ML-Paket
- Checks – ML-Paket
- Children Product Certificate – ML-Paket
- CMS1500 – ML-Paket
- EU Declaration of Conformity – ML-Paket
- Financial Statements – ML-Paket
- FM1003 – ML-Paket
- I9 – ML-Paket
- ID Cards – ML-Paket
- Invoices – ML-Paket
- InvoicesChina – ML-Paket
- Rechnungen Hebräisch – ML-Paket
- InvoicesIndia – ML-Paket
- InvoicesJapan – ML-Paket
- Invoices Shipping – ML-Paket
- Packing Lists – ML-Paket
- Passports – ML-Paket
- Gehaltsabrechnungen (Pay slips) – ML-Paket
- Purchase Orders – ML-Paket
- Receipts – ML-Paket
- RemittanceAdvices – ML-Paket
- UB04 – ML-Paket
- Utility Bills – ML-Paket
- Vehicle Titles – ML-Paket
- W2 – ML-Paket
- W9 – ML-Paket
- Andere out-of-the-box ML-Pakete
- Öffentliche Endpunkte
- Hardwareanforderungen
- Pipelines
- Dokumentmanager
- OCR-Dienste
- Deep Learning
- Insights-Dashboards
- Document Understanding – in der Automation Suite bereitgestellt
- Document Understanding – im eigenständigen AI Center bereitgestellt
- Lizenzierung
- Aktivitäten
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)
Document Understanding-Benutzerhandbuch.
Exportieren von Dokumenten
Mit dem Dialogfeld Dateien exportieren können Sie einfach Daten für das Training von ML-Modellen exportieren.
Klicken Sie in der Verwaltungsleiste auf die Schaltfläche Exportieren .
Das Dialogfeld enthält drei Registerkarten:
Optionen der Registerkarte Jetzt exportieren:
- In Excel herunterladen – Laden Sie die Daten lokal im Excel-Format herunter.
- Herunterladen – Laden Sie die Daten lokal herunter.
- In AI Center exportieren – Exportieren Sie die Daten in das AI Center. Die exportierten Ordner finden Sie im AI Center unter dem Ordner export (Datasets > dataset_name > export).
Wenn kein Schema definiert ist, sind alle Exportoptionen deaktiviert.
Wenn ein Schema definiert ist, muss für den Export ein Name eingegeben werden. Andernfalls sind die Schaltflächen Herunterladen und Exportieren deaktiviert. Ein gültiger Name kann bis zu 24 Zeichen lang sein und darf keine Sonderzeichen enthalten.
Sie können ein Schema exportieren oder herunterladen, auch wenn es Felder mit mehreren Werten enthält.
Sie können eine der folgenden Optionen für den Export auswählen:
- Aktuelle Suchergebnisse – die beschrifteten Dokumente, die nach einem vordefinierten Schlüsselwort/benannten Batch oder einer Textabfrage gefiltert werden. Wenn kein Filter angewendet wird, werden alle beschrifteten Dokumente in der aktuellen Ansicht exportiert.
- Alle beschrifteten – alle Dokumente mit mindestens einem beschrifteten Feld jeglicher Art; genauer gesagt die Dokumente aus dem Filter beschriftet.
- Schema – eine ZIP-Datei mit den Feldern und deren Konfigurationen, die in eine andere Document Manager-Sitzung importiert werden können.
- Alle – Exportiert alle Dokumente, unabhängig davon, ob Beschriftungen angewendet werden oder nicht.
Mit dem Kontrollkästchen Abwärtskompatibler Export können Sie das Exportverhalten der Legacy-Versionen anwenden, bei dem jede Seite als separates Dokument exportiert wird. Versuchen Sie dies, wenn das mit dem Standardexport trainierte Modell den Erwartungen nicht entspricht. Lassen Sie diese Option deaktiviert, um die Dokumente in ihrer ursprünglichen mehrseitigen Form zu exportieren.
Zum Exportieren eines Datasets müssen alle Felder in mindestens 10 verschiedenen Seiten beschriftet sein. Andernfalls schlägt der Export mit den folgenden Meldungen fehl:
Für Klassifizierungsfelder gibt es eine zusätzliche Anforderung: Jede Option muss in mindestens einem Dokument beschriftet werden. Andernfalls schlägt der Export mit der folgenden Meldung fehl:
Beim Exportieren nur von Auswertungssatzdaten sind alle Validierungen deaktiviert.
Ein Ordner, der das exportierte Dataset aus dem Document Manager enthält. Dies beinhaltet:
schema.json
: eine Datei mit den zu extrahierenden Feldern und deren Typensplit.csv
: Datei mit den Teilen jedes Dokuments, die während der Trainingspipeline entweder für TRAIN oder VALIDATE verwendet werden- images: Ordner mit Bildern aller beschrifteten Seiten
-
latest: Ordner mit
.json
-Dateien der beschrifteten Daten von jeder Seite
In der Registerkarte Protokolle wird das neueste Protokoll beim Exportieren angezeigt.
Im Falle eines erfolgreichen Exports zeigt das Protokoll die Anzahl der verarbeiteten Dokumente und die Exportdauer an.
Bei einem erfolgreichen Schemaexport zeigt das Protokoll die Exportdauer an.
Während des Dateiexports können Sie den Status des Exports überprüfen. Dies ist besonders nützlich für große Exporte.
Fehlermeldungen werden auch in Protokollen angezeigt, z. B.:
Im Falle eines erfolgreichen automatischen erneuten Trainings werden auch die Importprotokolle aus dem Ordner Feinabstimmung des Datasets angezeigt: