Document Understanding
最新
  • リリース ノート
バナーの背景画像
Document Understanding のリリース ノート
最終更新日 2024年5月7日

2022 年 5 月

リリース ノート - ML パッケージ

2022 年 5 月 10 日 | v22.4.0

DocumentUnderstanding (ドキュメントの理解) + DocumentClassifier (ドキュメント分類) + データ抽出 ML パッケージ

新着情報

HandwritingRecognitionOCR (手書き文字認識 OCR) の統合により、UiPathDocumentOCR (UiPath ドキュメント OCR) および UiPathDocumentOCR_CPU (UiPath ドキュメント OCR_CPU) パッケージで手書き文字の読み取り機能が使用できるようになりました。この機能は、Studio の UiPath.OCR.LocalServer パッケージにも含まれています。詳しくはこちらをご覧ください。

データ抽出用 ML パッケージのアーキテクチャが新しくなりました。これにより、特に DocumentUnderstanding (ドキュメントの理解) ML パッケージを使用してトレーニングされるモデルに大きなメリットがあります。

ML パッケージ Utility Bills (公共料金請求書)W9 (米国の納税申告書)Passports (パスポート)一般提供 (GA) を開始しました。すぐに使える、事前トレーニング済みの新しい ML パッケージを 5 つ追加しました (プレビュー)。

すぐに使える、事前トレーニング済みの新しい ML パッケージを 5 つ追加しました (プレビュー)。パッケージについて詳しくは、こちらをご覧ください。

Document Manager にドキュメント検索機能を追加し、ページ数が多いドキュメントでも簡単にラベル付けが行えるようにしました。

改良点

AI Center のドキュメント抽出用の ML パッケージを改良しました。評価用 Excel スプレッドシートに新しいシートを追加し、評価したデータを整理・解釈しやすくしました。

オフライン インストールの Automation Suite の ML パッケージに、新しいオフライン バンドルを追加しました。

UiPathDocumentOCR (UiPath ドキュメント OCR) の精度とパフォーマンスが向上しました。

バグ修正

列フィールドの日付、トルコ語ドキュメントの日付、遠い未来の日付など、日付フィールドの解析に関する複数の修正を行いました。

リリース ノート - Document Understanding

2022 年 5 月 30 日

新着情報

Document Understanding が一般向けに使用できるようになりました。Document Manager とフォーム AI を含む、より統合された新しいインターフェイスを備えています。UiPath Automation Cloud のお使いのテナントでサービスを有効化すると、左側のナビゲーション バーに新しいタブが表示されます。

フォーム AI が Document Understanding の一部として提供されるようになり、標準のレイアウトとフィールドを持つ、構造化されたフォームのアップロードと処理に使用できるようになりました。

Data Manager の名前を Document Manager に変更しました。

Document Manager に新しいオプションを追加し、個々のファイルを完全に削除できるようにしました。このオプションは、ダウンロード オプションを含むドロップダウン リストから利用できます。

以前作成したフィールドの名前を変更できるオプションを追加しました。

ドキュメント内の検索機能を追加し、現在のドキュメント内で単語を検索できるようになりました。

データセットのインポートから収集されたデータが、 subset フィールドの JSON ファイルに統合されるようになりました。これにより、ファイルを手動で変更したりデータセットから完全に削除したりしても、モデルのトレーニングに影響しなくなりました。

削除されたドキュメントが重複除去の対象から除外されるようになりました。このため、同じドキュメントを 2 回インポートできるようになりました。削除されたドキュメントは検索やフィルター処理の対象からも除外されるため、deleted というキーワードを使用しない限り、削除されていないドキュメントのみが検索されます。

ドキュメント ビューに利用開始のヒントを追加しました。

改良点

予測機能を Document Manager と一緒に使用する際に、ユーザーが手動で編集しなかったタグ付けされたデータが、モデルから取得した値で置き換えられるようになりました。

ドキュメントの種類 (トレーニング検証評価) を分かりやすく説明するツールチップを追加しました。

列フィールドと標準フィールドの編集ダイアログ ボックスを改良し、[後処理][複数ページ][スコアリング][色] オプションを [詳細設定] タブに移動しました。他のオプションは [全般] タブで設定できます。

重複するドキュメントのインポート速度が向上しました。

分類フィールドが作成された順序で表示されるようになりました。

バグ修正

  • ファイル名に URL エンコードを必要とする文字 (&,+#') が含まれるドキュメントの検索またはダウンロードが、無効なクエリとして失敗していた既知の問題を修正しました。
  • テキストの密度が非常に高いドキュメントで [予測] 機能が失敗する問題を修正しました。
  • セッションあたりでインポートできるドキュメントの上限 2,000 個を廃止しました。今後は、1 つのセッションに 2,000 個を超えるドキュメントをインポートできます。なお、1 回のインポートあたりのページ数の上限は 2,000 ページです。
  • ctrl キーまたは shift キーを押しても 4 つ以上のボックスを選択できませんでしたが、この問題を修正しました。
  • ポッドを再起動した後にジョブが再開しないと、タイムアウトするまでインポートの処理がハングする問題を修正しました。
  • [予測] 関数の実行時に、データがドキュメント全体から抽出されない問題を修正しました。なお、この関数をパブリック エンドポイントで使用する場合のページ数の上限は変わらず 10 ページです。
  • Microsoft Read OCR でサブドメイン *.cognitiveservices.azure.com に一致するエンドポイントを使用しようとすると「OCR endpoint is not valid (OCR エンドポイントが無効です)」というエラーが発生する問題を修正しました。
  • Document Manager へのデータセットのインポートにおいて、10 ページを超えるドキュメントのページの順序が乱れる問題を修正しました。
  • [ラベル付けされたデータすべて] オプションを選択すると、空のデータセット、または完全なデータセットの一部である少量のサブセットのみがダウンロードまたはエクスポートされる問題を修正しました。

既知の問題

  • インポートの最大サイズが 2GB または 2000 ページ から 1GB または 2000 ページに縮小されます。
  • ファイル名に URL エンコードを必要とする文字 (&,+#') が含まれるドキュメントを検索またはダウンロードすると、「invalid query (クエリが無効です。)」というエラーが発生して失敗します。

2022 年 5 月 24 日

改良点

Automation Cloud 上で Action Center を使用して検証ステーションを実行すると、メモリの消費量が増大する問題を修正しました。現在はすべてが期待どおりに動作し、メモリの消費量が通常の範囲内になりました。

2022 年 5 月 6 日

改良点

[予測] ボタンを [設定] ボタンの横に移動しました。

[バッチ名] を管理バーに追加しました。

MLPackages.View 権限の設定要求を AI Center から削除しました。

Was this page helpful?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
UiPath ロゴ (白)
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.