- リリース ノート
2023 年 2 月
エンドポイント + DocumentUnderstanding (ドキュメントの理解) + データ抽出用 ML パッケージでの公開 | v23.2.0
更新内容と改良点
すぐに使える事前トレーニング済みの ML パッケージの新しいバージョン (23.1.0) とパブリック エンドポイントを公開しました。このバージョンでは最先端の LayoutLM Transformers ベースのアーキテクチャが使用されているため、さらに強力になり、全体的な精度 (特に列フィールド (表)) が向上しました。
この改良により、トレーニングや予測にかかる待機時間が長くなる可能性があります。
待機時間による影響が大きい状況 (例: 有人シナリオ) では、GPU を使用して ML スキルとしてモデルをデプロイすることをお勧めします。
トレーニング/評価/フル パイプライン後のスコアの計算方法を改良し、列フィールドごとに別々のスコアが算出されるようにしました。以前は、共に取得されたすべての列フィールド全体の F1 スコアが計算されていました。
今後、モデルの評価で使用される手動編集機能の削除が予定されています。詳しくは、こちらをご覧ください。
既知の問題
現在、AI Center からのプロジェクトのインポートは無効化されています。この問題の解決に取り組んでおり、3 月末までに再び有効化される予定です。
追記 (2023 年 5 月 8 日)
既知の問題
Fatal Python error: Segmentation fault
」というエラーが発生します。この問題が修正されるまで、v23.4 の ML パッケージの使用をお勧めします。
追記 (2023 年 4 月 20 日)
すべてのパイプラインの総合スコアを F1 スコアから精度に変更しました。後方互換性を確保するため、AI Center の評価アーティファクトには精度と F1 スコアの両方が引き続き含まれます。