document-understanding
LATEST
false
- Document Understanding のリリース ノート
- ML パッケージとパブリック エンドポイントのリリース ノート
Document Understanding のリリース ノート
Last updated 2024年11月14日
2022 年 3 月
改良点
ドキュメントの種類 (トレーニング、検証、評価) を分かりやすく説明するツールチップを追加しました。
バグ修正
- ファイル名に URL エンコードを必要とする文字 (
&
、,
、+
、#
、'
) が含まれるドキュメントの検索またはダウンロードが、無効なクエリとして失敗していた既知の問題を修正しました。 - テキストの密度が非常に高いドキュメントで [予測] 機能が失敗する問題を修正しました。
改良点
ドキュメント内検索機能を実装しました。現在のドキュメント内に存在するテキストのインスタンスを検索できるため、ページ数が多いドキュメントの場合に特に便利です。この機能は画面の左下の検索バーから利用できます。検索バーにはショートカット キー「
Ctrl
+ Shift
+ F
」でアクセスすることもできます。
[予測] 機能の使用時に、手動でラベル付けしたデータが削除され、モデルからの新しい値でドキュメントが上書きされるようになりました。
データセットを別の Document Manager セッションにインポートする際やトレーニング パイプラインを実行する際に、
split.csv
が使用されなくなりました。このファイルのデータは、データセット内の latest フォルダー (より正確には subset フィールド) の JSON ファイルに統合されました。したがって、ファイルを手動で変更したりデータセットから完全に削除したりしても、モデルのトレーニングには影響しません。ただし、v21.10 以前の ML パッケージでは、このファイルは引き続きドキュメント レベルのエクスポートに使用されます。
個々のファイルを完全に削除するオプションを追加しました。このオプションは、ダウンロード オプションとともに、ドキュメント名の横にあるドロップダウン リストから利用できます。