Abonnieren

UiPath Document Understanding

UiPath Document Understanding

Exportieren von Dokumenten

Mit dem Dialogfeld Dateien exportieren können Sie einfach Daten für das Training von ML-Modellen exportieren.

Klicken Sie in der Verwaltungsleiste auf die Schaltfläche Exportieren exportexport.

Das Dialogfeld enthält drei Registerkarten:

792792

Jetzt exportieren

Optionen der Registerkarte Jetzt exportieren:

  • Lokaler Datendownload mit der Schaltfläche Herunterladen.
  • Datenexport mithilfe der Schaltfläche Exportieren in das AI Center. Die exportierten Ordner finden Sie im AI Center unter dem Ordner export (Datasets > dataset_name > export).

Wenn Sie zuerst herunterladen und dann das Dataset in das AI Center hochladen möchten, stellen Sie sicher, dass Sie das Dataset vor dem Hochladen entpacken.

Wenn kein Schema definiert ist, sind alle Exportoptionen deaktiviert.

792792

Wenn ein Schema definiert ist, muss für den Export ein Name eingegeben werden. Andernfalls sind die Schaltflächen Herunterladen und Exportieren deaktiviert. Ein gültiger Name kann bis zu 24 Zeichen lang sein und darf keine Sonderzeichen enthalten.

Sie können eine der folgenden Optionen für den Export auswählen:

  • Aktuelle Suchergebnisse – die beschrifteten Dokumente, die nach einem vordefinierten Schlüsselwort/benannten Batch oder einer Textabfrage gefiltert werden. Wenn kein Filter angewendet wird, werden alle beschrifteten Dokumente in der aktuellen Ansicht exportiert.
  • Alle beschrifteten – alle Dokumente mit mindestens einem beschrifteten Feld jeglicher Art; genauer gesagt die Dokumente aus dem Filter beschriftet.
  • Schema – eine ZIP-Datei mit den Feldern und deren Konfigurationen, die in eine andere Data Manager-Sitzung importiert werden können.

Mit dem Kontrollkästchen Abwärtskompatibler Export können Sie das Exportverhalten der Legacy-Versionen anwenden, bei dem jede Seite als separates Dokument exportiert wird. Versuchen Sie dies, wenn das mit dem Standardexport trainierte Modell den Erwartungen nicht entspricht. Lassen Sie diese Option deaktiviert, um die Dokumente in ihrer ursprünglichen mehrseitigen Form zu exportieren.

❗️

Wichtig!

Die Version 2021.10 des Data Managers unterstützt die Beschriftung von mehrseitigen Dokumenten. Dies ist eine größere Änderung gegenüber früheren Versionen, bei denen jede Seite separat beschriftet wurde. Das Beschriften und Exportieren von mehrseitigen Dokumenten geht davon aus, dass jedes Dokument ein einzelnes logisches Dokument darstellt. Beispielsweise kann ein sechsseitiges Dokument eine einzelne sechsseitiges Rechnung enthalten, darf aber keine drei verschiedenen Rechnungen à zwei Seiten enthalten. Dies ist insbesondere für Auswertungssätze wichtig.

Diese Anforderung ist für abwärtskompatible Exporte nicht relevant.

Exportvalidierung


Zum Exportieren eines Datasets müssen alle Felder in mindestens 10 verschiedenen Dokumenten beschriftet sein. Andernfalls schlägt der Export mit den folgenden Meldungen fehl:

472472 472472

Für Klassifizierungsfelder gibt es eine zusätzliche Anforderung: Jede Option muss in mindestens einem Dokument beschriftet werden. Andernfalls schlägt der Export mit der folgenden Meldung fehl:

589589

Beim Exportieren nur von Auswertungssatzdaten sind alle Validierungen deaktiviert.

Dataset-Format


Ein Ordner, der das exportierte Dataset aus Data Manager enthält. Dies beinhaltet:

  • schema.json: eine Datei mit den zu extrahierenden Feldern und deren Typen
  • split.csv: Datei mit den Teilen jedes Dokuments, die während der Trainingspipeline entweder für TRAIN oder VALIDATE verwendet werden
  • images: Ordner mit Bildern aller beschrifteten Seiten
  • latest: Ordner mit .json-Dateien der beschrifteten Daten von jeder Seite
14161416

Zeitplan Public Preview

The Schedule Export feature is documented here.

Protokolle

In der Registerkarte Protokolle wird das neueste Protokoll beim Exportieren angezeigt.

Im Falle eines erfolgreichen Exports zeigt das Protokoll die Anzahl der verarbeiteten Dokumente und die Exportdauer an.

879879

Bei einem erfolgreichen Schemaexport zeigt das Protokoll die Exportdauer an.

792792

Während des Dateiexports können Sie den Status des Exports überprüfen. Dies ist besonders nützlich für große Exporte.

879879

Fehlermeldungen werden auch in Protokollen angezeigt, z. B.:

879879

Im Falle eines erfolgreichen automatischen erneuten Trainings werden auch die Importprotokolle aus dem Ordner Feinabstimmung des Datasets angezeigt:

879879

Aktualisiert vor 8 Monaten


Exportieren von Dokumenten


Auf API-Referenzseiten sind Änderungsvorschläge beschränkt

Sie können nur Änderungen an dem Textkörperinhalt von Markdown, aber nicht an der API-Spezifikation vorschlagen.