
Document Understanding のリリース ノート
2022.10.0
link2022 年 11 月 14 日 | LTS リリース
linkAI Center での公開 | DocumentUnderstanding (ドキュメントの理解) + DocumentClassifier (ドキュメント分類) + データ抽出用 ML パッケージ
前回の LTS リリース以降に発生した ML パッケージに関する最新の変更点については、以下のリストをご覧ください。
新着情報
AI Center の Document Understanding Machine Learning パッケージに、さらに高度なモデル アーキテクチャを備えた新しいプレビュー版の ML パッケージを 18 個追加しました。InvoicesPreview、PurchaseOrderPreview、Acord125Preview など、パッケージ名の末尾に「Preview」が付いているため簡単に識別できます。
また、パブリック エンドポイントのリストに新しいプレビュー版の ML パッケージをすべて追加しました。詳しくは、こちらをご覧ください。
なお、これらのプレビュー モデルはお使いのライセンス プランで付与される DU/AI ユニットを消費しません。
10 個の新しいモデルの一般提供を開始しました。すぐに使える事前トレーニング済みの ML パッケージのリストについては、こちらをご覧ください。
ML Classification (ML 分類) のエンドポイントがプレビューで利用できるようになりました。
中国語、日本語、韓国語用の OCR のパブリック エンドポイントの一般提供を開始しました。
バグ修正
- プライベート スキルの使用に関する問題を修正し、AI Center インスタンスを使用している組織に属する API キーでのみプライベート スキルを使用できるようにしました。
eol classifier
メソッドとline_detection
メソッドを組み合わせて単一のメソッドにし、項目の分割が安定して行われるようにしました。- 抽出されたフィールドが検証ステーションの間違ったページに表示される問題を修正しました。
- Document Manager で、一部のページのテキストの最後の行がデジタル化されない問題を修正しました。
- AI Center のフル パイプライン/評価パイプラインで
evaluation_F1_invoices.txt
ファイルの F1 スコアの一部の項目が表示されない問題を修正しました。 - モデルのデータセットに列フィールドしか含まれない場合に、AI Center のフル パイプライン/評価パイプラインで
evaluation_F1_invoices.txt file
の全体の F1 スコアが誤って計算される問題を修正しました。 - 特別な
line_detection mode
を使用してトレーニングされたモデルで評価パイプラインを実行した時の予測結果が、ML スキルから呼び出した場合の結果と異なる問題を修正しました。
既知の問題
オフラインの Automation Suite 環境を v2021.10 から v2022.10 にアップグレードして v2021.10 にデプロイされた Document OCR スキルを使用しようとすると、エラーが発生します。この問題を一時的に修正するには、Document OCR スキルを再デプロイします。デプロイする前に、v2022.10 のオフライン バンドルを使用していることを確認してください。
2022 年 12 月 8 日
linkバグ修正
- フル パイプラインの実行時に、すぐに使える事前トレーニング済みのモデルが評価用ディレクトリにあるデータセットではなくトレーニング用のデータセットで評価されていました。この問題を修正し、評価プロセスが期待どおり実行されるようにしました。
2022 年 11 月 29 日
link更新内容と改良点
事前トレーニング済み ML パッケージ Invoices Australia (請求書 - オーストラリア) は非推奨となる予定です。代わりに、ML パッケージ Invoices (請求書) の使用をお勧めします。