- Document Understanding のリリース ノート
- ML パッケージとパブリック エンドポイントのリリース ノート
Document Understanding のリリース ノート
2022 年 5 月
更新内容
Document Understanding が一般向けに使用できるようになりました。Document Manager とフォーム AI を含む、より統合された新しいインターフェイスを備えています。UiPath Automation Cloud のお使いのテナントでサービスを有効化すると、左側のナビゲーション バーに新しいタブが表示されます。
フォーム AI が Document Understanding の一部として提供されるようになり、標準のレイアウトとフィールドを持つ、構造化されたフォームのアップロードと処理に使用できるようになりました。
Data Manager の名前を Document Manager に変更しました。
Document Manager に新しいオプションを追加し、個々のファイルを完全に削除できるようにしました。このオプションは、ダウンロード オプションを含むドロップダウン リストから利用できます。
以前作成したフィールドの名前を変更できるオプションを追加しました。
ドキュメント内の検索機能を追加し、現在のドキュメント内で単語を検索できるようになりました。
データセットのインポートから収集されたデータが、 subset フィールドの JSON ファイルに統合されるようになりました。これにより、ファイルを手動で変更したりデータセットから完全に削除したりしても、モデルのトレーニングに影響しなくなりました。
deleted
というキーワードを使用しない限り、削除されていないドキュメントのみが検索されます。
ドキュメント ビューに利用開始のヒントを追加しました。
改良点
予測機能を Document Manager と一緒に使用する際に、ユーザーが手動で編集しなかったタグ付けされたデータが、モデルから取得した値で置き換えられるようになりました。
ドキュメントの種類 (トレーニング、検証、評価) を分かりやすく説明するツールチップを追加しました。
列フィールドと標準フィールドの編集ダイアログ ボックスを改良し、[後処理]、[複数ページ]、[スコアリング]、[色] オプションを [詳細設定] タブに移動しました。他のオプションは [全般] タブで設定できます。
重複するドキュメントのインポート速度が向上しました。
分類フィールドが作成された順序で表示されるようになりました。
バグ修正
- ファイル名に URL エンコードを必要とする文字 (
&
、,
、+
、#
、'
) が含まれるドキュメントの検索またはダウンロードが、無効なクエリとして失敗していた既知の問題を修正しました。 - テキストの密度が非常に高いドキュメントで [予測] 機能が失敗する問題を修正しました。
- セッションあたりでインポートできるドキュメントの上限 2,000 個を廃止しました。今後は、1 つのセッションに 2,000 個を超えるドキュメントをインポートできます。なお、1 回のインポートあたりのページ数の上限は 2,000 ページです。
ctrl
キーまたはshift
キーを押しても 4 つ以上のボックスを選択できませんでしたが、この問題を修正しました。- ポッドを再起動した後にジョブが再開しないと、タイムアウトするまでインポートの処理がハングする問題を修正しました。
- [予測] 関数の実行時に、データがドキュメント全体から抽出されない問題を修正しました。なお、この関数をパブリック エンドポイントで使用する場合のページ数の上限は変わらず 10 ページです。
- Microsoft Read OCR でサブドメイン
*.cognitiveservices.azure.com
に一致するエンドポイントを使用しようとすると「OCR endpoint is not valid
(OCR エンドポイントが無効です)」というエラーが発生する問題を修正しました。 - Document Manager へのデータセットのインポートにおいて、10 ページを超えるドキュメントのページの順序が乱れる問題を修正しました。
- [ラベル付けされたデータすべて] オプションを選択すると、空のデータセット、または完全なデータセットの一部である少量のサブセットのみがダウンロードまたはエクスポートされる問題を修正しました。
既知の問題
- インポートの最大サイズが 2GB または 2000 ページ から 1GB または 2000 ページに縮小されます。
- ファイル名に URL エンコードを必要とする文字 (
&
、,
、+
、#
、'
) が含まれるドキュメントを検索またはダウンロードすると、「invalid query
(クエリが無効です。)」というエラーが発生して失敗します。
改良点
Automation Cloud 上で Action Center を使用して検証ステーションを実行すると、メモリの消費量が増大する問題を修正しました。現在はすべてが期待どおりに動作し、メモリの消費量が通常の範囲内になりました。