- Document Understanding のリリース ノート
- ML パッケージとパブリック エンドポイントのリリース ノート
- ML パッケージとパブリック エンドポイントの一般的な更新
- ML パッケージとパブリック エンドポイントのバージョン履歴

Document Understanding のリリース ノート
公開日: 2025 年 8 月 14 日
更新内容
欧州リージョンにおける、UiPath DocPath を基盤としたパブリック エンドポイントの精度を向上させました。
- 9465 (米国の分割納付申請書)
- Invoices China (請求書 - 中国)
- Invoices (請求書) (ヘブライ語)
- Invoices Japan (請求書 - 日本)
- Receipts Japan (領収書 - 日本)
今回の追加により、Financial Statements (財務諸表) を除くすべてのモデルが、欧州リージョンで UiPath DocPath を基盤とするようになりました。
新しいドキュメントの種類
- Invoices2 (請求書 2): このドキュメントの種類は、標準的な請求書、クレジット ノート、インドの請求書、船積送り状など、さまざまな種類の請求書から主要なデータ ポイントを抽出するようトレーニングされています。この改良されたスキーマは、55 個の標準フィールド、2 個の構造化テーブル (1 つは明細項目用 (13 列)、もう 1 つは銀行支払の詳細用 (9 列))、および通貨分類器で構成されています。
- Receipts2 (領収書 2): このドキュメントの種類は、駐車料金の領収書、電車のチケット、ホテルの領収書、空港での購入、食事、薬局の領収書、電子領収書など、さまざまな種類の領収書から主要なデータ ポイントを抽出するようトレーニングされています。この改良されたスキーマは、60 個の標準フィールドと、6 列の項目を含む構造化テーブルで構成されています。
- US Mortgage Closing Disclosures (米国のローン契約締結開示説明書): このドキュメントの種類は、標準的な米国の契約締結開示説明書のフォームから主要なデータ ポイントを抽出するようトレーニングされています。このスキーマには、借り手の詳細、不動産の情報、ローンの期間、取引の概要、クロージングに必要な現金額をキャプチャする 20 個の標準フィールドが含まれます。
リリース ノート: 2025 年 6 月 23 日
今回の更新では、光学式文字認識 (OCR) エンジンに一連の改良を加え、以下の幅広い入力スタイルに対する精度と信頼性の向上を目指しています。
-
手書き文字検出の向上
-
等幅フォントの「O」と「0」の区別の向上
-
ドットマトリクスで印刷されたテキストの認識の向上
これらの改良により、さまざまなドキュメントの種類で信頼性が向上します。
リリース ノート: 2025 年 5 月 19 日
Receipts Japan (領収書 - 日本) のドキュメントの種類を、API と、Intelligent OCR および Document Understanding のアクティビティを介して使用できるようになりました。この機能は、日本リージョンに拠点を置くすべてのテナントで利用できます。
公開日: 2025 年 4 月 11 日
2023.4 より古いすぐに使えるモデルの削除
新しい代替手段や改良されたソリューションがリリースされるため、すぐに使えるモデル (UiPath Document Understanding OCR と OCR_CPU、データ抽出 ML パッケージ、DocumentClassifier などのモデルのサポートを削除しました。
次の表では、削除計画について説明します。
機能 | 削除発表日 | 削除日 | 備考 |
---|---|---|---|
2023.4 より前の、すぐに使える ML パッケージ | 2025 年 4 月 | 2025 年 4 月 | すぐに使える ML パッケージの最新バージョンの使用をお勧めします。 |
非推奨化について詳しくは、『UiPath 概要ガイド』の「 非推奨化のタイムライン 」をご覧ください。
公開日: 2025 年 3 月 19 日
改良点
- チェックボックス、手書き文字、活字のテキストの検出が全体的に向上しました。
- 手書き文字の認識精度が向上しました。
- 日本語のスタンプでスタンプの検出が向上しました。
- 境界ボックスのサイズと位置の精度が向上しました。
公開日: 2024 年 11 月 28 日
新しいドキュメントの種類
このリリースでは、新しいドキュメントの種類 Receipts Japan (領収書 - 日本) が導入されました。この新しいパブリック エンドポイントでは、日本語で書かれた一般的なレジのレシート、レストラン、ホテル、電車、駐車場等の領収書など、さまざまなドキュメントの種類から重要な詳細情報を抽出できます。
UiPath DocPath に基づく Invoices China (請求書 - 中国) と Invoices Japan (請求書 - 日本) のパブリック エンドポイント
Invoices China (請求書 - 中国) と Invoices Japan (請求書 - 日本) のエンドポイントを改良しました。この新しい世代のエンドポイントは、UiPath DocPath という新しい UiPath LLM に基づいており、精度とパフォーマンスが向上しています。
Invoices Japan (請求書 - 日本) の改良
- 標準フィールド
- Net amount reduced (小計 (8% 対象))
- Tax reduced (消費税 8%)
- Net amount non-reduced (小計 (10% 対象))
- Tax non-reduced (消費税 10%)
- Withholding tax amount (源泉徴収額)
- Deposit (前受金)
- 列フィールド
- Item tax rate (明細行の税率)
- Item registration tax (明細行の登録税)
- Item fee (明細行の報酬額)
公開日: 2024 年 10 月 29 日
Invoices Japan (請求書 - 日本) のエンドポイントでの公開
改良点
ドキュメントのデジタル化プロセスを大幅に改良しました。これにより、UiPath Extended Languages OCR または Chinese, Japanese, Korean OCR の使用時に、個々の文字のボックスではなく通常の単語ボックスが出力されるようになりました。
公開日: 2024 年 10 月 15 日
Invoices Japan (請求書 - 日本) のエンドポイントでの公開
改良点
- Invoices Japan (請求書 - 日本) ML パッケージの精度が向上しました。
- ドキュメント内に中国語、日本語、または韓国語の文字とラテン文字、句読点、数字が混在している場合のスペースと単語の解析を強化しました。
- AI Center のトレーニング パイプラインで、
ID Number
およびPhone Number
のフィールドの種類に対して誤って高いスコアが報告される問題を修正しました。この修正により、報告されるスコアが実際のスコアと確実に一致するようになります。
公開日: 2024 年 10 月 3 日
UiPath の最新の OCR エンジンである UiPath Extended Languages OCR の一般提供を開始しました。この新しい OCR では 200 以上の言語のドキュメントをデジタル化することができ、特に中国語、日本語、韓国語に関して前モデルよりも大幅に改良されています。さらに、タイ語、ベトナム語、インドのすべての主要言語のほかに、キリル文字のアルファベットとギリシャ語のドキュメントも処理できます。
UiPath Extended Languages OCR (UiPath 拡張言語 OCR) は現在、パブリック エンドポイントとしてのみ利用可能です。
公開日: 2024 年 9 月 17 日
パフォーマンスの改良、および UiPath DocPath に登録された新しいモデル エンドポイント
このリリースでは、UiPath DocPath という新しい UiPath LLM に基づくモデルの精度とパフォーマンスが向上しています。さらに、以下のモデルも UiPath DocPath ベースになりました。
- 709 (米国の贈与税申告書)
- 941× (米国の雇用主による四半期連邦税修正申告書)
- 1040× (米国の個人所得税修正申告書)
- 3949
- 3949a (米国の課税・徴収漏れに関する情報提供フォーム)
古い世代にリダイレクトされるモデル エンドポイント
パフォーマンスの問題のため、Financial Statement (財務諸表) モデル エンドポイントは古い世代にリダイレクトされます。
プレビュー モデルの削除
990 (プレビュー) モデルをパブリック エンドポイントとデータ抽出 ML パッケージの両方から削除しました。
公開日: 2024 年 7 月 8 日
[UiPath Chinese, Japanese, Korean OCR] は 2025 年 1 月から非推奨になります。代わりに、[UiPath Extended Languages OCR] の使用をお勧めします。
今後の非推奨化と削除の予定について詳しくは、「非推奨化のタイムライン」をご覧ください。
公開日: 2024 年 6 月 12 日
請求書と領収書のエンドポイントを改良しました。この新しい世代は、UiPath DocPath という新しい UiPath LLM に基づいており、精度とパフォーマンスが向上しています。
- 709 (米国の贈与税申告書)
- 941× (米国の雇用主による四半期連邦税修正申告書)
- 1040× (米国の個人所得税修正申告書)
- 3949a (米国の課税・徴収漏れに関する情報提供フォーム)
- 9465 (米国の分割納付申請書)
- Invoices China (請求書 - 中国)
- Invoices (請求書) (ヘブライ語)
- Invoices Japan (請求書 - 日本)
今後のお知らせについてはリリース ノートをご覧ください。
公開日: 2024 年 5 月 29 日
事前トレーニング済みのすぐに使える ML パッケージの、改良されたエンドポイントを公開しました。この新しい世代は、UiPath DocPath という新しい UiPath® LLM に基づいており、精度とパフォーマンスが向上しています。
- 709 (米国の贈与税申告書)
- 941× (米国の雇用主による四半期連邦税修正申告書)
- 1040× (米国の個人所得税修正申告書)
- 3949a (米国の課税・徴収漏れに関する情報提供フォーム)
- 9465 (米国の分割納付申請書)
- Invoices (請求書)
- Invoices China (請求書 - 中国)
- Invoices (請求書) (ヘブライ語)
- Invoices Japan (請求書 - 日本)
- Receipts (領収書)
今後のお知らせについてはリリース ノートをご覧ください。
公開日: 2024 年 3 月 28 日
UiPath の最新の OCR エンジン、UiPath Extended Languages OCR がパブリック プレビューとして公開されました。この新しい OCR は 200 以上の言語のドキュメントをデジタル化することができ、特に中国語、日本語、韓国語に関して前モデルよりも大幅に改良されています。さらに、タイ語、ベトナム語、インドのすべての主要言語のほかに、キリル文字のアルファベットとギリシャ語のドキュメントも処理できます。
UiPath Extended Languages OCR (UiPath 拡張言語 OCR) は現在、パブリック エンドポイントとしてのみ利用可能です。
公開日: 2023 年 4 月 27 日
v23.4 以降の ML パッケージで、Frozen Backbone (フリーズしたバックボーン) を使用してトレーニングできるようになりました。この新しいアプローチでは、400 ページ未満のサイズが小さいまたは多様性の低いトレーニング セットの場合に、素早くトレーニングを実施してより良い結果を得ることができます。この挙動は、公式ドキュメントに記載されている新しいトレーニング パイプライン環境変数を使用して上書きできます。
公開日: 2022 年 11 月 29 日
事前トレーニング済み ML パッケージ Invoices Australia (請求書 - オーストラリア) は非推奨となる予定です。代わりに、ML パッケージ Invoices (請求書) の使用をお勧めします。詳しくは、こちらをご覧ください。
公開日: 2022 年 6 月 27 日
エンドポイントでの公開
ML Classification (ML 分類) のエンドポイントがパブリック プレビューで利用できるようになりました。
エンドポイント
公開日: 2022 年 6 月 20 日
エンドポイントでの公開
UiPath Chinese Japanese Korean OCR (中国語、日本語、韓国語用の UiPath OCR) のパブリック エンドポイントの一般提供を開始しました。
データ抽出 ML パッケージ
公開日: 2022 年 6 月 6 日
AI Center Cloud で公開、データ抽出用 ML パッケージ
新しい OCR メソッドとして UiPath Chinese, Japanese, Korean OCR が使用できるようになりました。これは、クラウド版 Document Understanding の新規または作成済みのプロジェクトに適用できます。
- UiPath DocPath のパブリック エンドポイントの改良
- 更新内容
- 新しいドキュメントの種類
- 文字認識機能の強化
- Receipts Japan (領収書 - 日本) のドキュメントの種類が API とアクティビティを介して利用可能に
- 2023.4 より古いすぐに使えるモデルの削除
- すぐに使えるモデルの削除 2023.4 より古い
- UiPath Document OCR のパブリック エンドポイントの公開
- 改良点
- UiPath DocPath のパブリック エンドポイントの公開
- 新しいドキュメントの種類
- UiPath DocPath に基づく Invoices China (請求書 - 中国) と Invoices Japan (請求書 - 日本) のパブリック エンドポイント
- Invoices Japan (請求書 - 日本) の改良
- Invoices Japan (請求書 - 日本) のパブリック エンドポイントのリリース
- 改良点
- 新しい Invoices Japan (請求書 - 日本) のパブリック エンドポイントのリリース
- 改良点
- UiPath Extended Languages OCR の一般提供 (GA) 開始
- UiPath® DocPath に基づく新しいパブリック エンドポイント
- パフォーマンスの改良、および UiPath DocPath に登録された新しいモデル エンドポイント
- 古い世代にリダイレクトされるモデル エンドポイント
- プレビュー モデルの削除
- UiPath Chinese, Japanese, Korean OCR (OCR - 中国語、日本語、韓国語) の非推奨化
- UiPath® DocPath に基づく請求書と領収書のパブリック エンドポイント
- DocPath に基づくパブリック エンドポイント
- UiPath Extended Languages OCR (UiPath 拡張言語 OCR) のパブリック プレビュー版を公開しました。
- Frozen Backbone (フリーズしたバックボーン) によるトレーニング
- Invoices Australia (請求書 - オーストラリア) の非推奨化
- ML Classification (ML 分類) のエンドポイントのパブリック プレビュー
- UiPath Chinese, Japanese, Korean OCR (OCR - 中国語、日本語、韓国語) の公開
- エンドポイント
- データ抽出 ML パッケージ