Document Understanding
最新
偽
- リリース ノート
- 2024 年 5 月
- 2024 年 4 月
- 2024 年 3 月
- 2024 年 2 月
- 2024 年 1 月
Document Understanding のリリース ノート
最終更新日 2024年5月16日
2024 年 3 月
更新内容
[構築] セクションの推奨事項のインターフェイスを改良しました。推奨事項が分類と抽出に分けられ、分類の推奨事項と抽出の推奨事項を必要に応じて個別に確認できるようになりました。
バグ修正
- 注釈時にブラウザー ウィンドウを再読み込みすると、表示していたドキュメントが保持されない問題を修正しました。
- 一部のドキュメントで、[フィールド] パネルには値が表示されているのに、表ビューに表データが表示されない問題を修正しました。
- 注釈時に 2 文字のホットキーが機能しない問題を修正しました。
更新内容
UiPath Extended Languages OCR (UiPath 拡張言語 OCR) のパブリック プレビュー版を公開しました。
UiPath の最新の OCR エンジン、UiPath Extended Languages OCR がパブリック プレビューとして公開されました。この新しい OCR は 200 以上の言語のドキュメントをデジタル化することができ、特に中国語、日本語、韓国語に関して前モデルよりも大幅に改良されています。さらに、タイ語、ベトナム語、インドのすべての主要言語のほかに、キリル文字のアルファベットとギリシャ語のドキュメントも処理できます。
UiPath Extended Languages OCR (UiPath 拡張言語 OCR) は現在、パブリック エンドポイントとしてのみ利用可能です。
データ抽出 ML パッケージでの公開
すぐに使える事前トレーニング済みの ML パッケージに、一般的な使用向けの新しいバージョンを追加しました。
今回のリリースでは、400 ページ未満のデータセットの精度が向上しました。
更新内容
公開されたバージョン:
- DocumentUnderstandingOCR エンドポイント | v24.3.2
- データ抽出 ML パッケージ | v23.10.4
Document Understanding OCR と、すぐに使える事前トレーニング済みの ML パッケージに、一般的な使用向けの新しいバージョンを追加しました。
今回のリリースでは以下の改良を行いました。
- トルコ語 (TUR) の精度が向上しました。発音区別符号 (Ç、ç、Ğ、ğ、I、ı、İ、i、Ş、ş、Ö、ö、Ü、ü など) が付いた文字のパフォーマンスが向上しました。
- 東アラビア数字 (٠、١、٢、٣、٤、٥、٦、٧、٨、٩) の精度が向上しました。