Document Understanding のリリース ノート
2023.4.0
前回の LTS リリース以降に発生した ML パッケージに関する最新の変更点については、以下のリストをご覧ください。
すぐに使える、事前トレーニング済みの新しい ML パッケージを 7 つ追加しました。以下のリストをご覧ください。
- Certificate of incorporation/Good Standing (会社存在証明書)
- Certif of Origin (原産地証明書)
- Children's Product Certificate (子供向け製品証明書)
- CMS 1500 (米国の医療保険請求フォーム)
- EU Declaration of Conformity (EU 適合宣言書)
- Invoices Shipping (船積送り状)
- Pay slips (給与明細)
すぐに使える事前トレーニング済みの ML パッケージの新しいバージョン (23.1.0) とパブリック エンドポイントを公開しました。このバージョンでは最先端の LayoutLM Transformers ベースのアーキテクチャが使用されているため、さらに強力になり、全体的な精度 (特に列フィールド (表)) が向上しました。
Invoices (請求書) モデルに新しい抽出フィールドとして、Shipping Date (出荷日)、Vendor email address (ベンダーのメール アドレス)、Bank name (銀行名)、Bank account number (銀行の口座番号)、IBAN、SWIFT Code (SWIFT コード)、Bank Address (銀行の住所)、Bank Routing number (銀行のルーティング ナンバー)、Tax rate (税率) を追加しました。
AI Center のトレーニング/評価/フル トレーニング パイプラインで表示されるメイン スコアが、F1 スコアではなく精度になりました。これは、正確な予測の割合として定義されます。一般に、精度の数値は F1 よりも大きくなりますが、理解しやすく解釈も容易です。また、詳細なスコアが個々の列フィールドごとに表示されるようになりました。古いバージョンでは、すべての列フィールドをひとまとまりにしたスコアしか利用できませんでした。F1 スコアは引き続き各パイプラインの artefacts/eval_metrics フォルダーで利用できるので、以前のリリースとの一貫性が確保されます。
エクスポートのスケジュール機能 (プレビュー) が更新され、新しく 7 日間の最小繰り返し間隔が追加されました。既存のエクスポートの繰り返し間隔はすべて、新しい最小値である 7 日以上に更新されます。
UiPath Document OCR のパブリック エンドポイントを更新し、ドイツ語とフランス語の手書き文字のサポートと、デンマーク語、フィンランド語、ノルウェー語、スウェーデン語の活字のサポートを追加しました。
データのラベル付けの要件を 10 か所 (同じページ上に存在する可能性あり) から異なる 10 ページに変更し、エクスポートされるデータの精度を向上させました。
待機時間による影響が大きい状況 (例: 有人シナリオ) では、GPU を使用して ML スキルとしてモデルをデプロイすることをお勧めします。
Document Manager のインポートにおけるページ制限を削除しました。ただし、1 回のインポートあたりのサイズ制限は 4,000 MiB です。
非推奨化および削除される機能に関する最新情報については、非推奨化のタイムラインを定期的に確認することをお勧めします。