Document Understanding のリリースノート

デリバリー:

Automation Cloud Automation Cloud Public Sector Automation Suite Standalone

最終更新日時 2024年12月12日

2022 年 3 月

リリースノート - Document Understanding

2022 年 3 月 29 日

改良点

ドキュメントの種類 (トレーニング、検証、評価) を分かりやすく説明するツールチップを追加しました。

バグ修正

ファイル名に URL エンコードを必要とする文字 (&、 ,、 +、 #、 ') が含まれるドキュメントの検索またはダウンロードが、無効なクエリとして失敗していた既知の問題を修正しました。
テキストの密度が非常に高いドキュメントで [予測] 機能が失敗する問題を修正しました。

2022 年 3 月 7 日

改良点

ドキュメント内検索機能を実装しました。現在のドキュメント内に存在するテキストのインスタンスを検索できるため、ページ数が多いドキュメントの場合に特に便利です。この機能は画面の左下の検索バーから利用できます。検索バーにはショートカットキー「Ctrl + Shift + F」でアクセスすることもできます。

[予測] 機能の使用時に、手動でラベル付けしたデータが削除され、モデルからの新しい値でドキュメントが上書きされるようになりました。

データセットを別の Document Manager セッションにインポートする際やトレーニングパイプラインを実行する際に、split.csv が使用されなくなりました。このファイルのデータは、データセット内の latest フォルダー (より正確には subset フィールド) の JSON ファイルに統合されました。したがって、ファイルを手動で変更したりデータセットから完全に削除したりしても、モデルのトレーニングには影響しません。ただし、v21.10 以前の ML パッケージでは、このファイルは引き続きドキュメントレベルのエクスポートに使用されます。

個々のファイルを完全に削除するオプションを追加しました。このオプションは、ダウンロードオプションとともに、ドキュメント名の横にあるドロップダウンリストから利用できます。