- Document Understanding のリリース ノート
- ML パッケージとパブリック エンドポイントのリリース ノート
Document Understanding のリリース ノート
2024 年 5 月
更新内容
- 10 個以上の質問をするとパフォーマンスが低下する。
- 新しい質問を追加するか、既存の質問を変更すると常に、特定の質問に対する回答が変動する。
Discovery API における生成 AI 抽出器と生成 AI 分類器
生成 AI 抽出器と生成 AI 分類器が Discovery API で返されるようになりました。これを使用して、API で生成 AI 抽出器または生成 AI 分類器を使用してページを処理できます。
詳細については、『Document Understanding API ガイド』の「Discovery API を使用する」セクションをご覧ください。
API によるドキュメント データ抽出時の抽出結果の信頼度の向上
boostExtractionConfidence
を利用できるようになりました。このパラメーターは、API を使用してドキュメント データを抽出する場合に抽出結果の信頼度を高めるために使用します。
詳細については、『Document Understanding API ガイド』の「抽出サービスを使用する」セクションをご覧ください。
バグ修正
- Document Manager セッションで列フィールドの値がフリーズする問題を修正しました。この問題は、抽出されたフィールド値を手動で編集したために発生することがありました。
- Action Center の問題を修正し、[空である] ビジネス ルールが正しく表示されるようになりました。
更新内容
- 10 個以上の質問をするとパフォーマンスが低下する。
- 新しい質問を追加するか、既存の質問を変更すると常に、特定の質問に対する回答が変動する。
バグ修正
トレーニング パイプラインのスコアと実行中のオートメーションで得られるパフォーマンスに差が生じる原因となっていた、Document Manager のクラシック プロジェクトのバグを修正しました。この問題は、Automation Cloud™ と Automation Suite 両方の多様性の低いデータセット (レイアウトが 10 個未満) に特に影響を及ぼします。この問題を最も明確に確認できるのは、ロボット ワークフローで処理されたドキュメントの結果が、AI Center のパイプラインの成果物フォルダー内にある Excel の評価ファイルの結果と比較して低い場合です。
この修正は、Automation Suite バージョン 2023.10 用の 6 月の累積的な更新にも含まれる予定です。
この修正のメリットを得るには、Document Manager セッションからデータセットを再エクスポートします。その後、モデルをトレーニング、テスト、デプロイするための通常の手順を進めます。
- パイプラインについて
- Document Manager を使用してデータセットをエクスポートする
- ワン クリック抽出でドキュメントをトレーニングする
- AI Center を使用して ML スキルをデプロイする
追記 (2024 年 5 月 23 日): バグの具体的な動作に関する詳細情報と、関連情報へのリンクを追加しました。
Discovery API における生成 AI 抽出器と生成 AI 分類器
生成 AI 抽出器と生成 AI 分類器が Discovery API で返されるようになりました。これを使用して、API で生成 AI 抽出器または生成 AI 分類器を使用してページを処理できます。
詳細については、『Document Understanding API ガイド』の「Discovery API を使用する」セクションをご覧ください。
API によるドキュメント データ抽出時の抽出結果の信頼度の向上
boostExtractionConfidence
を利用できるようになりました。このパラメーターは、API を使用してドキュメント データを抽出する場合に抽出結果の信頼度を高めるために使用します。
詳細については、『Document Understanding API ガイド』の「抽出サービスを使用する」セクションをご覧ください。