通知を受け取る

UiPath Document Understanding

UiPath Document Understanding

2022.4.0

Release date Document Manager On-Premises: 23 May 2022

前回の LTS リリース以降に発生した Document Manager に関する最新の変更点については、以下のリストをご覧ください。

新着情報

Data Manager changes its name to Document Manager.

A new option is available, allowing you to permanently delete individual files. The option can be found in the drop down that also contains the download option.

You now have the option to rename previously created fields.

Search inside a document is now possible, allowing you to search for words in your current document.

Data gathered from importing a dataset is now integrated into the JSON files of the subset field, meaning that if you manually modify the file or delete it completely from the dataset, it does not have an impact over the training of the model.

Deleted documents are now excluded from deduplication, meaning that you can now import the same document twice. Deleted documents are also excluded from searching or filtering, so it only searches non-deleted documents unless you are using the deleted keyword.

Document view has received new getting started tips.

改良点

An on-premise deployment that is using SQL Server installation with the full-text search option disabled, requires, at installation time, a restart of the full-text search service to enable it. This can be done by running the EXEC sp_fulltext_service 'restart_all_fdhosts' command by a DBA with the appropriate permissions on the server.

When using the Predict functionality along with Document Manager, tagged data that was not manually edited by the user is replaced with the values received from the model.

Added more descriptive tooltips on Training, Validation, and Evaluation document types.

The edit field dialog box for column and regular fields has been restructured. Post processing, Multi page, Scoring, and Color options have been moved to the Advanced tab. The rest of the options can be found in the General tab.

580580

重複するドキュメントのインポート速度が向上しました。

分類フィールドが作成された順序で表示されるようになりました。

バグ修正

  • Fixed a known issue that was causing the search or the download of a document which contained characters that require URL encoding (& , + # ') in its file name to fail with an invalid query.
  • テキストの密度が非常に高いドキュメントで [予測] 機能が失敗する問題を修正しました。
  • セッションあたりでインポートできるドキュメントの上限 2,000 個を廃止しました。今後は、1 つのセッションに 2,000 個を超えるドキュメントをインポートできます。なお、1 回のインポートあたりのページ数の上限は 2,000 ページです。
  • Fixed a bug that was not allowing you to select more than 3 boxes when pressing ctrl または shift です。
  • ポッドを再起動した後にジョブが再開しないと、タイムアウトするまでインポートの処理がハングする問題を修正しました。
  • Fixed a bug that prevented the Predict function from extracting data from the entire document. Please note that the 10 page limit when using the function with Public Endpoints is still in place.
  • Fixed a bug for Microsoft Read OCR where endpoints matching the *.cognitiveservices.azure.com subdomains were throwing an OCR endpoint is not valid error.
  • Document Manager へのデータセットのインポートにおいて、10 ページを超えるドキュメントのページの順序が乱れる問題を修正しました。
  • [ラベル付けされたデータすべて] オプションを選択すると、空のデータセット、または完全なデータセットの一部である少量のサブセットのみがダウンロードまたはエクスポートされる問題を修正しました。

既知の問題

  • インポートの最大サイズが 2GB または 2000 ページ から 1GB または 2000 ページに縮小されます。
  • Searching or downloading a document containing characters that require URL encoding (& , + # ') in its file name fails with invalid query です。

For more details about all changes that occurred in Document Manager, please consult the previous Release Notes.

2022 年 6 月 3 日

既知の問題

  • Type3 フォントを含む一部の PDF ファイルではデジタル化サービスでのメモリ使用量が増加することがあります。この際、Document Manager からのインポート操作のパフォーマンスが低下します。この問題を軽減するには、メモリ使用量が多い (常に 70% を超える) Kubernetes の Pod を手動で削除します。

3 か月前に更新


2022.4.0


改善の提案は、API リファレンスのページでは制限されています

改善を提案できるのは Markdown の本文コンテンツのみであり、API 仕様に行うことはできません。