- 概要
- 基本情報
- モデルを構築する
- モデルを使用する
- 詳細
- Automation Cloud と Test Cloud のパブリック エンドポイント
- Automation Cloud および Test Cloud (公共部門向け) のパブリック エンドポイント
- 1040 (米国の個人所得税修正申告書) - ドキュメントの種類
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ドキュメントの種類
- (米国の個人所得税申告書のスケジュール D) - ドキュメントの種類
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ドキュメントの種類
- 1040x (米国の個人所得税修正申告書) - ドキュメントの種類
- 3949a (米国の課税・徴収漏れに関する情報提供フォーム) - ドキュメントの種類
- 4506T (米国の納税申告証明依頼書) - ドキュメントの種類
- 709 (米国の贈与税申告書) - ドキュメントの種類
- 941× (米国の雇用主による四半期連邦税修正申告書) - ドキュメントの種類
- 9465 (米国の分割納付申請書) - ドキュメントの種類
- ACORD125 (企業向け保険契約申込書) - ドキュメントの種類
- ACORD126 (企業総合賠償責任保険) - ドキュメントの種類
- ACORD131 (アンブレラ/エクセス保険) - ドキュメントの種類
- ACORD140 (商業保険申込書の財物補償条項) - ドキュメントの種類
- ACORD25 (賠償責任保険証明書) - ドキュメントの種類
- Bank Statements (銀行預金残高証明書) - ドキュメントの種類
- BillsOfLading (船荷証券) - ドキュメントの種類
- Certificate of Incorporation (会社存在証明書) - ドキュメントの種類
- Certificate of Origin (原産地証明書) - ドキュメントの種類
- Checks (小切手) - ドキュメントの種類
- Children's Product Certificate (子供向け製品証明書) - ドキュメントの種類
- CMS 1500 (米国の医療保険請求フォーム) - ドキュメントの種類
- EU Declaration of Conformity (EU 適合宣言書) - ドキュメントの種類
- Financial Statements (財務諸表) - ドキュメントの種類
- FM1003 (米国の統一住宅ローン申請書) - ドキュメントの種類
- I9 (米国の就労資格証明書) - ドキュメントの種類
- ID Cards (ID カード) - ドキュメントの種類
- Invoices (請求書) - ドキュメントの種類
- Invoices2 (請求書 2) - ドキュメントの種類
- InvoicesAustralia (請求書 - オーストラリア) - ドキュメントの種類
- Invoices China (請求書 - 中国) - ドキュメントの種類
- Invoices Hebrew (請求書 - ヘブライ語) - ドキュメントの種類
- Invoices India (請求書 - インド) - ドキュメントの種類
- Invoices Japan (請求書 - 日本) - ドキュメントの種類
- Invoices Shipping (船積送り状) - ドキュメントの種類
- Packing Lists (梱包明細書) - ドキュメントの種類
- Pay slips (給与明細) - ドキュメントの種類
- Passports (パスポート) - ドキュメントの種類
- Purchase Orders (発注書) - ドキュメントの種類
- Receipts (領収書) - ドキュメントの種類
- Receipts2 (領収書 2) - ドキュメントの種類
- Receipts Japan (領収書 - 日本) - ドキュメントの種類
- Remittance Advices (送金通知書) - ドキュメントの種類
- UB-04 (健康保険請求フォーム) - ドキュメントの種類
- US Mortgage Closing Disclosures (米国のローン契約締結開示説明書) - ドキュメントの種類
- Utility Bills (公共料金の請求書) - ドキュメントの種類
- Vehicle Titles (自動車の権利書) - ドキュメントの種類
- W2 (米国の源泉徴収票) - ドキュメントの種類
- W9 (米国の納税申告書) - ドキュメントの種類
- サポートされている言語
- Insights のダッシュボード
- データおよびセキュリティ
- ログ
- ライセンス
- 使い方
- トラブルシューティング
Document Understanding ガイド
クラシック プロジェクトまたは AI Center に基づくプロジェクトを移行するには、このページの手順を使用します。プロジェクトの移行には、次の 2 つの主要な手順があります。
- クラシック プロジェクトまたは AI Center に基づくプロジェクトからデータセットをエクスポートします。
- エクスポートしたデータセットをモダン プロジェクトにインポートします。
現在の制限事項
- 現在、5,000 ページを超えるデータセットのインポートはサポートされていません。最初の 5,000 ページのみが正常にインポートされ、それ以降のページはインポートに失敗します。たとえば、データセットが 4,999 ページで構成されている場合に、4 ページのドキュメントをインポートしようとすると、このプロセスは成功しません。
- バッチ名および対応するバッチ結果は、現在は利用できません。データがバッチに編成されている場合、バッチ結果の情報はまだ表示されません。ただし、情報は保存されています。
- AI Center からのエクスポートはサポートされていません。Document Manager からのエクスポートのみがサポートされています。
クラシック プロジェクトからデータセットをエクスポートする
- 移行するクラシック プロジェクトに移動し、プロジェクトを開きます。
- エクスポートするドキュメントの種類に移動し、[ドキュメントの種類を開く] を選択します。
図 1.ドキュメントの種類を開く

- [ドキュメントをフィルター処理] ドロップダウン リストから、[トレーニングと検証セット] を選択します。
図 2. トレーニングと検証セット

- [エクスポート] を選択します。
- [現在の検索結果] を選択したままにして、エクスポート ジョブの名前を入力します。
- [Download] を選択します。
図 3. エクスポートをダウンロードする
![[ファイルをエクスポート] インターフェイスのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/latest-screenshot-of-the-export-files-interface-393852-9599b66e-3fd7ff83.webp)
AI Center に基づくプロジェクトからデータセットをエクスポートする
-
AI Center を開き、[データのラベル付け] ページに移動します。
-
移行するデータのラベル付けセッションを選択します。
![[データのラベル付けアプリを新規作成] インターフェイスのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/latest-screenshot-of-the-create-new-data-labeling-app-interface-439093-3e8d27aa-22a0d6ec.webp)
-
Document Manager が開いたら、[ドキュメントをフィルター処理] ドロップダウン リストから [トレーニングと検証セット] を選択します。
図 4. トレーニングと検証セット
![[フィルター] フィールドのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/latest-screenshot-of-filtering-field-393844-19c57061-482320b5.webp)
- [エクスポート] を選択します。
- [現在の検索結果] を選択したままにして、エクスポート ジョブの名前を入力します。
- [Download] を選択します。
図 5. エクスポートをダウンロードする
![[ファイルをエクスポート] インターフェイスのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/latest-screenshot-of-the-export-files-interface-393852-9599b66e-3fd7ff83.webp)
データセットをインポートする
- データのインポート先のプロジェクトに移動して、プロジェクトを開きます。
- [ドキュメントの種類を追加] を選択し、新しいカスタム ドキュメントの種類を作成します。
図 6. ドキュメントの種類を追加
![[ドキュメントの種類を追加] インターフェイスのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/latest-screenshot-of-the-add-document-type-interface-393862-07f12389-351d3964.webp)
- 新しいカスタム ドキュメントの種類で [アップロード] を選択し、エクスポートしたクラシック プロジェクトの zip ファイルを選択します。アップロードが完了するまで待ちます。
注:
AI Center からのエクスポートはサポートされていません。Document Manager からのエクスポートのみがサポートされています。
図 7. アップロード処理

アップロードが完了したら、ドキュメントをトレーニングで利用できます。
モデルのトレーニング
データセットがインポートされると、モデルのトレーニングが開始されます。トレーニングの完了後、モデルのスコアが表示されます。モデルの詳細なスコアを確認するには、スコアを選択して、[モデルの詳細なスコア] を選択します。
![[モデルの評価] インターフェイスのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/latest-screenshot-of-the-model-rating-interface-387790-b3167829-c4cd898f.webp)
この操作を行うと [測定] ページに移動し、モデルの詳細なメトリックにアクセスできます。
同じデータセットを使用して ML を 2 回トレーニングすると、モデルのメトリックがわずかに異なることに気付く場合があります。これは、以下のようないくつかの理由で発生する可能性があります。
- 初期化: 機械学習では、最適化アルゴリズムをトリガーするために初期推測が必要な最適化手法を使用します。これらのアルゴリズムは予測不可能な性質であるため、トレーニングごとに初期推測が異なり、さまざまな結果につながる可能性があります。
- ランダムなステート: 一部のアルゴリズムでは、その処理にランダム性を使用します。たとえば、ニューラル ネットワークをトレーニングする場合、確率的勾配降下法やミニバッチ勾配降下法のような手順でランダム性が取り入れられます。そのため、モデルの初期パラメーターとデータセットが同一であっても、実行ごとにモデルのパフォーマンスが異なる場合があります。
- 正則化: 特定のアルゴリズムには、モデルがより小さな重みを維持するよう促進するペナルティ項が含まれています。ランダム性が関係するため、モデルは毎回異なる重みセットで動作する可能性があります。
ただし、このようにわずかな違いがあっても、必ずしもあるモデルに他のモデルと比べて優劣があることを意味するわけではないことに注意することが重要です。メトリックがわずかに異なっていても、非常に大きな違いでない限り、モデルがデータを理解する能力に基本的に変わりはありません。さらに、このプロセスを何度も繰り返して平均を取ると、同様のパフォーマンス メトリックが得られるはずです。
ドキュメントの種類マネージャーでベース モデルを変更する
クラシック プロジェクトとモダン プロジェクトのモデルの結果に大きな違いがある場合は、ベース モデルの違いが原因である可能性があります。ベース モデルを変更するには、次の手順に進みます。
-
カスタムのドキュメントの種類から 3 点リーダー メニューを選択し、[ドキュメントの種類マネージャー] を選択します。
![[ドキュメントの種類マネージャー] ボタンのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/latest-screenshot-of-the-document-type-manager-button-453478-83a91bbf-f87c16b3.webp)
-
[設定] タブに移動します。
-
[ベース モデル] ドロップダウン リストから目的のモデルを選択します。
![[ベース モデル] ドロップダウン リストのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/latest-screenshot-of-the-base-model-drop-down-list-453487-6b61225e-cd86acda.webp)
-
選択が完了したら、[保存] を選択します。終了するには、[戻る] を選択します。
エクスポートの種類
クラシック プロジェクトでは、さまざまな方法でデータをエクスポートできます。ただし、エクスポートしたデータの種類すべてが、モダン プロジェクトへのインポートに対応しているわけではありません。両方の種類のプロジェクトでモデルの結果を比較するには、[トレーニングと検証セット] でドキュメントをフィルター処理し、[現在の検索結果を選択] を選択してデータセットをエクスポートします。各オプションについて詳しくは、以下の表をご覧ください。
| エクスポートの種類 | エクスポートされるデータ | インポートしたデータのこの後の流れ |
|---|---|---|
| 現在の検索結果 | 現在フィルター処理されているデータセットをエクスポートします。これを [トレーニングと検証セット] フィルターと併せて使用します。 | 「トレーニング」としてタグ付けされたドキュメントは、モデルのトレーニングに使用されます。「検証」としてタグ付けされたドキュメントは、モデルのパフォーマンスの測定に使用されます。ヒント: 2 つのプロジェクトの種類の間でモデルの結果を比較するには、必ずデータセットを 「トレーニングと検証 セット」としてエクスポートしてインポートします。 |
| ラベル付けされたデータすべて | すべてのアノテーション済みのドキュメントをデータセットからエクスポートします。
|
|
| スキーマ | フィールドのリストと、そのそれぞれの設定をエクスポートします。 | スキーマが存在しない場合はインポートされます。スキーマがすでに定義されている場合、インポートは失敗します。 |
| すべて | アノテーション済みのドキュメントとアノテーション未実施のドキュメントをすべてエクスポートします。 |
|
スキーマをインポートする
スキーマをデータセットと共にモダン プロジェクトにインポートできます。スキーマをインポートするには、以下の手順を実行します。
- [構築] セクションでカスタムのドキュメントの種類を作成します。
- スキーマが含まれる zip ファイルをインポートします。
注:
- スキーマのインポートは、既存のスキーマを持たないカスタムのドキュメントの種類に限られます。
- すでにスキーマが含まれるドキュメントの種類にスキーマをインポートした場合、インポートは失敗します。
オートメーション ワークフローを移行する
RPA オートメーションでクラシック DU プロジェクトからモダン プロジェクトに移行するには、1 つの変更が必要です。[データ抽出スコープ] 内の [ML 抽出器] アクティビティを「Document Understanding プロジェクト抽出器」に置き換えます。他のアクティビティを変更する必要はありません。デジタル化、検証、トレーニングのアクティビティに変更はありません。
ワークフローでドキュメント分類を使用している場合は、既存の分類器を Document Understanding プロジェクト分類器にも置き換えます。以下の 「分類を移行 する」をご覧ください。
[ML 抽出器] アクティビティを置き換えます
- Studio プロジェクトで、[ データ抽出スコープ] アクティビティを開きます。
- 既存の [ML 抽出器] アクティビティを削除します。
- [データ抽出スコープ] 内に Document Understanding プロジェクト抽出器を追加します。
- [ 抽出器機能を取得または更新 ] を選択して、構成ウィザードを開きます。
- [ 設計時の資格情報] に、 アプリ ID、 アプリ シークレット、 テナント URL を入力します。
- [ プロジェクトを取得 ] を選択して、利用可能なモダン プロジェクトのリストを読み込みます。
- [プロジェクト] で、ドロップダウン リストから目的のモダン プロジェクトを選択します。
- [ バージョン] で、プロジェクトのデプロイ済みバージョンを選択します。または、特定のバージョンにリンクされている タグ を選択します。バージョンとタグは相互に排他的です。
- [機能を取得] を選択します。
- [アクティビティの引数を更新] がオンになっていることを確認します。
別のテナントのプロジェクトに接続する場合は、アクティビティの [認証 ] プロパティ ( [実行時の資格情報アセット ] と [ 実行時のテナント URL ]) を、ウィザードで使用した資格情報と一致するように設定します。
構成について詳しくは、「 Document Understanding プロジェクト抽出器」をご覧ください。
分類を移行する
オートメーションでドキュメント分類を使用する場合は、既存の分類器を [ドキュメント分類スコープ] 内の Document Understanding プロジェクト分類器に置き換えます。設定手順は抽出器と同様です。 分類器を設定ウィザードを開き、設計時の資格情報を入力し、プロジェクトとバージョンまたはタグを選択して、[ 機能を取得] を選択します。
構成について詳しくは、「 Document Understanding プロジェクト分類器」をご覧ください。