Abonnieren

UiPath Document Understanding

UiPath Document Understanding

Oktober 2021

19. Oktober 2021

Verbesserungen

Felder mit weniger als 10 beschrifteten Dokumenten können ohne Bestätigung gelöscht werden.

Bug Fixes

  • Es wurde ein Fehler behoben, der importierte Dateien mit demselben Namen betraf.
  • Es wurde ein Fehler in Google OCR behoben, der einen Fehler bei Dokumenten mit leeren Seiten ausgeworfen hat.
  • Es wurde ein Fehler behoben, der die Anzahl der Dateien im Dialogfeld Daten importieren für Dataset-Importe der Validation Station oder des Data Manager falsch anzeigte.

Bekannte Probleme (Known Issues)

  • Der Standardexport (Dokumentebene) funktioniert nur mit ML-Paketen der Version 21.10 oder höher im AI Center. Die Version wird in der Spalte Änderungsprotokoll der Ansicht „ML-Pakete“ im AI Center angezeigt. Verwenden Sie für ältere Versionen das Kontrollkästchen Abwärtskompatibler Export im Dialogfeld Dateien exportieren.

1. Oktober 2021

Unterstützung von mehrseitigen Dokumenten

Der Data Manager unterstützt jetzt mehrseitige Dokumente. Dies ist ein umfangreiches Update, das sich auf jeden Aspekt eines Machine Learning-Flows auswirkt:

Import: you can upload documents up to 150 pages; to bypass this limit, at the risk of an unstable labeling experience, select the Enable large documents checkbox from the Import data dialog box.

Prelabeling: the document is prelabeled as a whole, producing the same results as running in RPA workflow, but it takes more time in case of larger documents. See also Known Issues below.

Labeling: more convenient labeling due to natural scrolling through document pages.

Export: done by default at document level. Should you want to export the documents at page level, select the Backwards-compatible export checkbox from the Export files dialog box; this is also recommended if the model accuracy produced by the default export is below expectations.

Training: on most scenarios, the models trained with the new document level exported datasets should have the same performance with the page level Backwards-compatible export. However, if the models perform below expectations, we recommend that you retry the training using a Backwards-compatible export as well, in case it might produce better results.

Evaluation: this is the main motivation for the multi-page document support feature, since Evaluations scores will more accurately reflect run time performance. Please note that this assumes that each multi-page document contains a single logical document. For instance, if you import 20 page file packets containing 10 invoices of 2 pages each, then this should not be used as part of Evaluation sets. However, they can be used as part of Training sets but only if you export using the Backwards-compatible option enabled.

Verbesserungen

Exportieren der Schemaunterstützung mithilfe des Optionsfelds im Dialogfeld Dateien exportieren.

Die maximale Importgröße wurde auf 2 GB oder 2000 Seiten erhöht.

Der Testsatz wurde für die Konsistenz mit den AI Center-Auswertungspipelines in Auswertungssatz umbenannt.

Die Schaltfläche Vorhersage wird standardmäßig in der Verwaltungsleiste angezeigt, aber die Einstellungen zum Vorbeschriften müssen konfiguriert werden, damit die Schaltfläche aktiviert ist.

Alle Einschränkungen für die Anzahl der Proben pro Feld wurden aus den Exporten von Auswertungssätzen entfernt.

In der Verwaltungsleiste wurde der Data Manager-Sitzungsname neben dem Dateinamen hinzugefügt, um die Sitzung, an der Sie arbeiten, einfacher zu identifizieren, falls mehrere Data Manager-Registerkarten gleichzeitig geöffnet sind.

Dokumente in chinesischer Sprache werden unterstützt.

Verbesserungen der Barrierefreiheit.

Lokalisierung für Portugiesisch – Portugal, Russisch und Türkisch.

Bekannte Probleme (Known Issues)

  • Das Modell zu Rechnungen China formatiert die chinesischen Daten nicht im Standardformat jjjj-mm-tt. Das wird in zukünftigen Versionen verbessert.

  • Die Data Manager-Analysen stimmen nicht mit den von ML-Modellen zur Laufzeit durchgeführten Analysen überein. Wenn Sie feststellen, dass Daten in Data Manager falsch analysiert werden, werden sie wahrscheinlich zur Laufzeit in der Modellvorhersage korrekt analysiert. Das ist ein bekanntes Problem und wird bald in einem Patch behoben.

  • At the moment, using the Predict option with Public Endpoints prelabels only the first 10 pages of a document. This is a known issue and an enhancement will be included in an upcoming patch. Using the Predict option with ML Skills in AI Center, however, does not impose such a limitation.

Aktualisiert vor 5 Monaten


Oktober 2021


Auf API-Referenzseiten sind Änderungsvorschläge beschränkt

Sie können nur Änderungen an dem Textkörperinhalt von Markdown, aber nicht an der API-Spezifikation vorschlagen.