UiPath Document Understanding

UiPath Document Understanding

2022 年 5 月

リリース ノート - ML パッケージ

2022 年 6 月 3 日 | v22.4.1

Release date in AI Center Cloud | Data Extraction ML Packages


特別な line_detection mode を使用してトレーニングされたモデルで評価パイプラインを実行した時の予測結果が、ML スキルから呼び出した場合の結果と異なる問題を修正しました。

2022 年 5 月 10 日 | v22.4.0

DocumentUnderstanding (ドキュメントの理解) + DocumentClassifier (ドキュメント分類) + データ抽出 ML パッケージ


Handwriting capabilities are now available for the UiPathDocumentOCR and the UiPathDocumentOCR_CPU packages, by integrating the HandwritingRecognitionOCR. The same capabilities can be found in the UiPath.OCR.LocalServer Studio package. More details about it can be found here.

New architecture on extraction ML Packages, with major benefits, especially to models trained using the DocumentUnderstanding ML Package.

Utility Bills, W9, and Passports ML Packages are now available as GA. Five new out-of-the-box pre-trained ML Packages are now available in -Preview to ease your work.

Five new out-of-the-box pre-trained ML Packages are now available in -Preview to ease your work. Here you can find all the needed information about them.

Document Search is a new feature available in Document Manager facilitating labelling documents with a high number of pages.


Improvements have been made to the ML Packages for document extraction in AI Center. The Evaluation Excel spreadsheet has received new sheets, allowing you to better organize and interpret the evaluated data. More information about this can be found here.

ML Packages in Automation Suite offline installation have received a new offline bundle. More information about this can be found here.

Accuracy and performance have been improved for the UiPathDocumentOCR.


Multiple fixes on parsing date fields, including dates in Column fields, dates in Turkish documents, dates far into the future.

新しい ML パッケージ、パッケージ バージョン: 22.4.0

ML PackagePublic PreviewGenerally Available

更新された ML パッケージ、パッケージ バージョン: 22.4.0

ML PackagePublic PreviewGenerally Available

2022 年 6 月 28 日


  • 抽出されたフィールドが検証ステーションの間違ったページに表示されることがあります。

リリース ノート - Document Understanding サービス

2022 年 6 月 9 日


データセット診断機能を新しく追加しました。新しいモデルのトレーニング プロセス全体を通して視覚的かつ文字によるガイダンスが表示されるため、効果的なデータセットを構築しやすくなりました。

2022 年 5 月 30 日


Document Understanding Service is now available for general use, bringing a new, more integrated interface, that includes Document Manager and Forms AI. Enable the service on your tenant in UiPath Cloud and a new tab becomes available in the left navigation bar.

Forms AI is now available as part of the Document Understanding Service and can be used for uploading and processing structured forms with standard layouts and fields.

Data Manager changes its name to Document Manager.

A new option is available in Document Manager, allowing you to permanently delete individual files. The option can be found in the drop down that also contains the download option.

You now have the option to rename previously created fields.

Search inside a document is now possible, allowing you to search for words in your current document.

Data gathered from importing a dataset is now integrated into the JSON files of the subset field, meaning that if you manually modify the file or delete it completely from the dataset, it does not have an impact over the training of the model.

Deleted documents are now excluded from deduplication, meaning that you can now import the same document twice. Deleted documents are also excluded from searching or filtering, so it only searches non-deleted documents unless you are using the deleted keyword.

Document view has received new getting started tips.


When using the Predict functionality along with Document Manager, tagged data that was not manually edited by the user is replaced with the values received from the model.

Added more descriptive tooltips on Training, Validation, and Evaluation document types.

The edit field dialog box for column and regular fields has been restructured. Post processing, Multi page, Scoring, and Color options have been moved to the Advanced tab. The rest of the options can be found in the General tab.




  • ファイル名に URL エンコードを必要とする文字 (&,+#') が含まれるドキュメントの検索またはダウンロードが、無効なクエリとして失敗していた既知の問題を修正しました。
  • テキストの密度が非常に高いドキュメントで [予測] 機能が失敗する問題を修正しました。
  • セッションあたりでインポートできるドキュメントの上限 2,000 個を廃止しました。今後は、1 つのセッションに 2,000 個を超えるドキュメントをインポートできます。なお、1 回のインポートあたりのページ数の上限は 2,000 ページです。
  • ctrl キーまたは shift キーを押しても 4 つ以上のボックスを選択できませんでしたが、この問題を修正しました。
  • ポッドを再起動した後にジョブが再開しないと、タイムアウトするまでインポートの処理がハングする問題を修正しました。
  • Fixed a bug that prevented the Predict function from extracting data from the entire document. Please note that the 10 page limit when using the function with Public Endpoints is still in place.
  • Microsoft Read OCR でサブドメイン *.cognitiveservices.azure.com に一致するエンドポイントを使用しようとすると「OCR endpoint is not valid (OCR エンドポイントが無効です)」というエラーが発生する問題を修正しました。
  • Document Manager へのデータセットのインポートにおいて、10 ページを超えるドキュメントのページの順序が乱れる問題を修正しました。
  • [ラベル付けされたデータすべて] オプションを選択すると、空のデータセット、または完全なデータセットの一部である少量のサブセットのみがダウンロードまたはエクスポートされる問題を修正しました。


  • インポートの最大サイズが 2GB または 2000 ページ から 1GB または 2000 ページに縮小されます。
  • ファイル名に URL エンコードを必要とする文字 (&,+#') が含まれるドキュメントを検索またはダウンロードすると、「invalid query (クエリが無効です。)」というエラーが発生して失敗します。

For more details about all changes that occurred in Document Manager, please consult the previous Release Notes.

2022 年 6 月 6 日


新しい OCR メソッドとして UiPath Chinese, Japanese, Korean OCR が使用できるようになりました。これは、クラウド版 Document Understanding サービスの新規または作成済みのプロジェクトに適用できます。

2022 年 5 月 24 日


Automation Cloud 上で Action Center を使用して検証ステーションを実行すると、メモリの消費量が増大する問題を修正しました。現在はすべてが期待どおりに動作し、メモリの消費量が通常の範囲内になりました。

2022 年 5 月 6 日


[予測] ボタンを [設定] ボタンの横に移動しました。

[バッチ名] を管理バーに追加しました。

MLPackages.View 権限の設定要求を AI Center から削除しました。

3 日前に更新

2022 年 5 月

改善の提案は、API リファレンスのページでは制限されています

改善を提案できるのは Markdown の本文コンテンツのみであり、API 仕様に行うことはできません。