- Document Understanding のリリース ノート
- ML パッケージとパブリック エンドポイントのリリース ノート
- ML パッケージとパブリック エンドポイントの一般的な更新
- ML パッケージとパブリック エンドポイントのバージョン履歴

Document Understanding のリリース ノート
公開日: 2025 年 12 月 4 日
改良点
ハワイ語のテキストを含むドキュメントの認識精度を向上させるため、ハワイ語の発音区別符号のサポートを追加しました。
公開日: 2025 年 11 月 7 日
更新内容
- Public endpoints for extraction models in the United States, with the exception of Financial Statements, are now based on the Helix Extractor.
- 米国のパブリック エンドポイントに、Receipts2 (領収書 2)、Invoices2 (請求書 2)、Receipts Japan (領収書 - 日本)、US Mortgage Closing Disclosures (米国のローン契約締結開示説明書) が含まれるようになりました。詳細については、パブリック エンドポイントのドキュメントに移動し、表を展開してスクロール可能な完全なリストを表示してください。アクティビティがサーバーのリージョンに応じて正しいエンドポイントに接続していることを確認することをお勧めします。
Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.
更新内容
- Public endpoints for extraction models in Japan, with the exception of Financial Statements, are now based on the Helix Extractor.
- 日本のパブリック エンドポイントに、Receipts2 (領収書 2)、Invoices2 (請求書 2)、US Mortgage Closing Disclosures (米国のローン契約締結開示説明書) が含まれるようになりました。詳細については、パブリック エンドポイントのドキュメントに移動し、表を展開してスクロール可能な完全なリストを表示してください。アクティビティがサーバーのリージョンに応じて正しいエンドポイントに接続していることを確認することをお勧めします。
Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.
公開日: 2025 年 8 月 14 日
更新内容
We are excited to announce the release of improved accuracy for public endpoints based on the UiPath Helix Extractor in Europe region.
- 9465 (米国の分割納付申請書)
- Invoices China (請求書 - 中国)
- Invoices (請求書) (ヘブライ語)
- Invoices Japan (請求書 - 日本)
- Receipts Japan (領収書 - 日本)
With this addition, all models are now based on the UiPath Helix Extractor in Europe region, except for Financial Statements.
新しいドキュメントの種類
- Invoices2 (請求書 2): このドキュメントの種類は、標準的な請求書、クレジット ノート、インドの請求書、船積送り状など、さまざまな種類の請求書から主要なデータ ポイントを抽出するようトレーニングされています。この改良されたスキーマは、55 個の標準フィールド、2 個の構造化テーブル (1 つは明細項目用 (13 列)、もう 1 つは銀行支払の詳細用 (9 列))、および通貨分類器で構成されています。
- Receipts2 (領収書 2): このドキュメントの種類は、駐車料金の領収書、電車のチケット、ホテルの領収書、空港での購入、食事、薬局の領収書、電子領収書など、さまざまな種類の領収書から主要なデータ ポイントを抽出するようトレーニングされています。この改良されたスキーマは、60 個の標準フィールドと、6 列の項目を含む構造化テーブルで構成されています。
- US Mortgage Closing Disclosures (米国のローン契約締結開示説明書): このドキュメントの種類は、標準的な米国の契約締結開示説明書のフォームから主要なデータ ポイントを抽出するようトレーニングされています。このスキーマには、借り手の詳細、不動産の情報、ローンの期間、取引の概要、クロージングに必要な現金額をキャプチャする 20 個の標準フィールドが含まれます。
Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.
リリース ノート: 2025 年 6 月 23 日
今回の更新では、光学式文字認識 (OCR) エンジンに一連の改良を加え、以下の幅広い入力スタイルに対する精度と信頼性の向上を目指しています。
-
手書き文字検出の向上
-
等幅フォントの「O」と「0」の区別の向上
-
ドットマトリクスで印刷されたテキストの認識の向上
これらの改良により、さまざまなドキュメントの種類で信頼性が向上します。
リリース ノート: 2025 年 5 月 19 日
Receipts Japan (領収書 - 日本) のドキュメントの種類を、API と、Intelligent OCR および Document Understanding のアクティビティを介して使用できるようになりました。この機能は、日本リージョンに拠点を置くすべてのテナントで利用できます。
公開日: 2025 年 4 月 11 日
2023.4 より古いすぐに使えるモデルの削除
新しい代替手段や改良されたソリューションがリリースされるため、すぐに使えるモデル (UiPath Document Understanding OCR と OCR_CPU、データ抽出 ML パッケージ、DocumentClassifier などのモデルのサポートを削除しました。
次の表では、削除計画について説明します。
| 機能 | 削除発表日 | 削除日 | 備考 |
|---|---|---|---|
| 2023.4 より前の、すぐに使える ML パッケージ | 2025 年 4 月 | 2025 年 4 月 | すぐに使える ML パッケージの最新バージョンの使用をお勧めします。 |
非推奨化について詳しくは、『UiPath 概要ガイド』の「 非推奨化のタイムライン 」をご覧ください。
公開日: 2025 年 3 月 19 日
改良点
- チェックボックス、手書き文字、活字のテキストの検出が全体的に向上しました。
- 手書き文字の認識精度が向上しました。
- 日本語のスタンプでスタンプの検出が向上しました。
- 境界ボックスのサイズと位置の精度が向上しました。
公開日: 2024 年 11 月 28 日
新しいドキュメントの種類
このリリースでは、新しいドキュメントの種類 Receipts Japan (領収書 - 日本) が導入されました。この新しいパブリック エンドポイントでは、日本語で書かれた一般的なレジのレシート、レストラン、ホテル、電車、駐車場等の領収書など、さまざまなドキュメントの種類から重要な詳細情報を抽出できます。
Public endpoints for Invoices China and Invoices Japan based on UiPath Helix Extractor
We are excited to announce the release of improved endpoints for Invoices China and Invoices Japan. This new generation of endpoints, based on the UiPath Helix Extractor, the new UiPath LLM, brings enhanced accuracy and performance.
Invoices Japan (請求書 - 日本) の改良
- 標準フィールド
- Net amount reduced (小計 (8% 対象))
- Tax reduced (消費税 8%)
- Net amount non-reduced (小計 (10% 対象))
- Tax non-reduced (消費税 10%)
- Withholding tax amount (源泉徴収額)
- Deposit (前受金)
- 列フィールド
- Item tax rate (明細行の税率)
- Item registration tax (明細行の登録税)
- Item fee (明細行の報酬額)
Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.
公開日: 2024 年 10 月 29 日
Invoices Japan (請求書 - 日本) のエンドポイントでの公開
改良点
ドキュメントのデジタル化プロセスを大幅に改良しました。これにより、UiPath Extended Languages OCR または Chinese, Japanese, Korean OCR の使用時に、個々の文字のボックスではなく通常の単語ボックスが出力されるようになりました。
公開日: 2024 年 10 月 15 日
Invoices Japan (請求書 - 日本) のエンドポイントでの公開
改良点
- Invoices Japan (請求書 - 日本) ML パッケージの精度が向上しました。
- ドキュメント内に中国語、日本語、または韓国語の文字とラテン文字、句読点、数字が混在している場合のスペースと単語の解析を強化しました。
- AI Center のトレーニング パイプラインで、
ID NumberおよびPhone Numberのフィールドの種類に対して誤って高いスコアが報告される問題を修正しました。この修正により、報告されるスコアが実際のスコアと確実に一致するようになります。
公開日: 2024 年 10 月 3 日
UiPath の最新の OCR エンジンである UiPath Extended Languages OCR の一般提供を開始しました。この新しい OCR では 200 以上の言語のドキュメントをデジタル化することができ、特に中国語、日本語、韓国語に関して前モデルよりも大幅に改良されています。さらに、タイ語、ベトナム語、インドのすべての主要言語のほかに、キリル文字のアルファベットとギリシャ語のドキュメントも処理できます。
UiPath Extended Languages OCR (UiPath 拡張言語 OCR) は現在、パブリック エンドポイントとしてのみ利用可能です。
公開日: 2024 年 9 月 17 日
Improved performance and new model endpoints enrolled on UiPath Helix Extractor
This release brings enhanced accuracy and performance for models based on the UiPath Helix Extractor, the new UiPath LLM. Furthermore, the following models are now based on the UiPath Helix Extractor as well:
- 709 (米国の贈与税申告書)
- 941× (米国の雇用主による四半期連邦税修正申告書)
- 1040× (米国の個人所得税修正申告書)
- 3949
- 3949a (米国の課税・徴収漏れに関する情報提供フォーム)
古い世代にリダイレクトされるモデル エンドポイント
パフォーマンスの問題のため、Financial Statement (財務諸表) モデル エンドポイントは古い世代にリダイレクトされます。
プレビュー モデルの削除
990 (プレビュー) モデルをパブリック エンドポイントとデータ抽出 ML パッケージの両方から削除しました。
Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.
公開日: 2024 年 7 月 8 日
[UiPath Chinese, Japanese, Korean OCR] は 2025 年 1 月から非推奨になります。代わりに、[UiPath Extended Languages OCR] の使用をお勧めします。
今後の非推奨化と削除の予定について詳しくは、「非推奨化のタイムライン」をご覧ください。
公開日: 2024 年 6 月 12 日
We are excited to announce the release of improved endpoints for Invoices and Receipts. This new generation, based on the UiPath Helix Extractor, the new UiPath LLM, brings enhanced accuracy and performance.
- 709 (米国の贈与税申告書)
- 941× (米国の雇用主による四半期連邦税修正申告書)
- 1040× (米国の個人所得税修正申告書)
- 3949a (米国の課税・徴収漏れに関する情報提供フォーム)
- 9465 (米国の分割納付申請書)
- Invoices China (請求書 - 中国)
- Invoices (請求書) (ヘブライ語)
- Invoices Japan (請求書 - 日本)
今後のお知らせについてはリリース ノートをご覧ください。
Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.
公開日: 2024 年 5 月 29 日
We are excited to announce the release of improved endpoints for our pre-trained, out-of-the-box ML packages. This new generation, based on the UiPath Helix Extractor, the new UiPath® LLM, brings enhanced accuracy and performance.
- 709 (米国の贈与税申告書)
- 941× (米国の雇用主による四半期連邦税修正申告書)
- 1040× (米国の個人所得税修正申告書)
- 3949a (米国の課税・徴収漏れに関する情報提供フォーム)
- 9465 (米国の分割納付申請書)
- Invoices (請求書)
- Invoices China (請求書 - 中国)
- Invoices (請求書) (ヘブライ語)
- Invoices Japan (請求書 - 日本)
- Receipts (領収書)
今後のお知らせについてはリリース ノートをご覧ください。
Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.
公開日: 2024 年 3 月 28 日
UiPath の最新の OCR エンジン、UiPath Extended Languages OCR がパブリック プレビューとして公開されました。この新しい OCR は 200 以上の言語のドキュメントをデジタル化することができ、特に中国語、日本語、韓国語に関して前モデルよりも大幅に改良されています。さらに、タイ語、ベトナム語、インドのすべての主要言語のほかに、キリル文字のアルファベットとギリシャ語のドキュメントも処理できます。
UiPath Extended Languages OCR (UiPath 拡張言語 OCR) は現在、パブリック エンドポイントとしてのみ利用可能です。
公開日: 2023 年 4 月 27 日
v23.4 以降の ML パッケージで、Frozen Backbone (フリーズしたバックボーン) を使用してトレーニングできるようになりました。この新しいアプローチでは、400 ページ未満のサイズが小さいまたは多様性の低いトレーニング セットの場合に、素早くトレーニングを実施してより良い結果を得ることができます。この挙動は、公式ドキュメントに記載されている新しいトレーニング パイプライン環境変数を使用して上書きできます。
公開日: 2022 年 11 月 29 日
事前トレーニング済み ML パッケージ Invoices Australia (請求書 - オーストラリア) は非推奨となる予定です。代わりに、ML パッケージ Invoices (請求書) の使用をお勧めします。詳しくは、こちらをご覧ください。
公開日: 2022 年 6 月 27 日
エンドポイントでの公開
ML Classification (ML 分類) のエンドポイントがパブリック プレビューで利用できるようになりました。
エンドポイント
公開日: 2022 年 6 月 20 日
エンドポイントでの公開
UiPath Chinese Japanese Korean OCR (中国語、日本語、韓国語用の UiPath OCR) のパブリック エンドポイントの一般提供を開始しました。
データ抽出 ML パッケージ
公開日: 2022 年 6 月 6 日
AI Center Cloud で公開、データ抽出用 ML パッケージ
新しい OCR メソッドとして UiPath Chinese, Japanese, Korean OCR が使用できるようになりました。これは、クラウド版 Document Understanding の新規または作成済みのプロジェクトに適用できます。
- UiPath Document OCR のパブリック エンドポイントの公開
- 改良点
- UiPath Helix Extractor public endpoints improvements
- 更新内容
- UiPath Helix Extractor public endpoints improvements
- 更新内容
- UiPath Helix Extractor public endpoints improvements
- 更新内容
- 新しいドキュメントの種類
- 文字認識機能の強化
- Receipts Japan (領収書 - 日本) のドキュメントの種類が API とアクティビティを介して利用可能に
- 2023.4 より古いすぐに使えるモデルの削除
- 2023.4 より古いすぐに使えるモデルの削除
- UiPath Document OCR のパブリック エンドポイントの公開
- 改良点
- UiPath Helix Extractor public endpoints release
- 新しいドキュメントの種類
- Public endpoints for Invoices China and Invoices Japan based on UiPath Helix Extractor
- Invoices Japan (請求書 - 日本) の改良
- Invoices Japan (請求書 - 日本) のパブリック エンドポイントのリリース
- 改良点
- 新しい Invoices Japan (請求書 - 日本) のパブリック エンドポイントのリリース
- 改良点
- UiPath Extended Languages OCR の一般提供 (GA) 開始
- New public endpoints based on UiPath® Helix Extractor
- Improved performance and new model endpoints enrolled on UiPath Helix Extractor
- 古い世代にリダイレクトされるモデル エンドポイント
- プレビュー モデルの削除
- UiPath Chinese, Japanese, Korean OCR (OCR - 中国語、日本語、韓国語) の非推奨化
- Public endpoints for Invoices and Receipts based on UiPath® Helix Extractor
- Public endpoints based on Helix Extractor
- UiPath Extended Languages OCR (UiPath 拡張言語 OCR) のパブリック プレビュー版を公開しました。
- Frozen Backbone (フリーズしたバックボーン) によるトレーニング
- Invoices Australia (請求書 - オーストラリア) の非推奨化
- ML Classification (ML 分類) のエンドポイントのパブリック プレビュー
- UiPath Chinese, Japanese, Korean OCR (OCR - 中国語、日本語、韓国語) の公開
- エンドポイント
- データ抽出 ML パッケージ