document-understanding
2024.10
true
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。
新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
Document Understanding のリリース ノート
2024.10.0
公開日: 2024 年 11 月 11 日
Document Understanding™ 2024.10 LTS リリース
UiPath の最新の OCR エンジンである UiPath Extended Languages OCR の一般提供を開始しました。この新しい OCR では 200 以上の言語のドキュメントをデジタル化することができ、特に中国語、日本語、韓国語に関して前モデルよりも大幅に改良されています。さらに、タイ語、ベトナム語、インドのすべての主要言語、およびキリル文字のアルファベットとギリシャ語のドキュメントも処理できます。
以下の新しい ML パッケージが新しく利用できるようになりました。
ドキュメントのデジタル化プロセスを大幅に改良しました。これにより、UiPath Extended Languages OCR の使用時に、個々の文字のボックスではなく通常の単語ボックスが出力されるようになりました。
- 今回のリリースでは、手書き文字認識の精度とパフォーマンスが向上しました。
- 磁気インク文字認識 (MIRC) の認識と検出が改良され、特に小切手において精度が向上しました。
- 以前は、スペースが区切り文字として使用されていると、数字が認識されないことがありました。今回のリリースから、スペースが区切り文字として使用されていても数字が認識されるようになりました。
- 特に低品質の画像で使用した場合に、UiPath Document Understanding OCR の信頼度スコアが向上しました。ドキュメントを Action Center で人間が検証する必要があるかどうかを、信頼度スコアを使用して判断するワークフローでは、これにより、検証するドキュメントの数が増える可能性があります。