UiPath Documentation
document-understanding
2023.10
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
UiPath logo, featuring letters U and I in white

Document Understanding ガイド

最終更新日時 2026年4月6日

フォームからデータを抽出する

重要:

このページは、Document Understanding TM を初めて使用するユーザーに Document Understanding TM の機能を分かりやすく紹介するためのページです。

運用環境へのスケーラブルなデプロイを実現するには、UiPath® Studio の [テンプレート] セクションにある Document Understanding Process を使用することを強くお勧めします。

このクイックスタートでは、 インテリジェント フォーム抽出器を使用して W-9 フォームから情報を抽出するために必要な手順について説明します。例として W-9 フォームが使用されていますが、データは構造化されている他の種類のドキュメントでも手順は同様です。

ゼロから始める場合、以下の手順に従う必要があります。

  1. 空のプロセスを作成する
  2. 必要なアクティビティ パッケージをインストールする
  3. タクソノミーを作成する
  4. ドキュメントをデジタル化する
  5. [インテリジェント フォーム抽出器] アクティビティを使用してデータを抽出する
  6. 検証ステーションを使用して結果を検証する
  7. 抽出結果をエクスポート

1. 空のプロセスを作成する

UiPath Studio を起動します。

[ホーム] の Backstage ビューで [プロセス] を選択して、新しいプロジェクトを作成します。

[新しい空のプロセス] ウィンドウが表示されます。このウィンドウで、新しいプロジェクトの名前を入力します。プロジェクトを簡単に見つけられるように、必要に応じてプロジェクトの説明を追加することもできます。

[ 作成] を選択します。新しいプロジェクトが Studio で開きます。

2. 必要なアクティビティ パッケージをインストールする

既定でプロジェクトに追加されるコア アクティビティ パッケージ (UiPath.Excel.ActivitiesUiPath.Mail.ActivitiesUiPath.System.ActivitiesUiPath.UIAutomation.Activities) に加えて、リボンの [パッケージを管理] ボタンから、次のアクティビティ パッケージをインストールします。

3. タクソノミーを作成する

アクティビティ パッケージをインストールしたら、必要なフィールドをリストアップします。この例では、以下のフィールドのデータを抽出します。

  • 1_Name - Text
  • 2_BusinessName - Text
  • 3a_Individual - Boolean
  • 3b_CCorp - Boolean
  • 3c_SCorp - Boolean
  • 3d_Partnership - Boolean
  • 3e_TrustEstate - Boolean
  • 3f_LLC - Boolean
  • 3f_LLCTaxClassification - Boolean
  • 3g_Other - Boolean
  • 3g_OtherDetail - Boolean
  • 5_Address - Text
  • 6_CityStateZip - Text
  • 7_AcctNumber - Text
  • TIN_SSN - Text
  • TIN_ETN - Text
  • Certification_Signature - Boolean
  • Certification_SignatureDate - Date

タクソノミー マネージャーを開き、「構造化ドキュメント」という名前のグループ、「融資フォーム」という名前のカテゴリ、「W-9」という名前のドキュメントの種類を作成します。わかりやすい名前とそれぞれのデータ型を持つ createdlisted フィールド。

[タクソノミー マネージャー] を示すスクリーンショット

4. ドキュメントをデジタル化する

Main.xaml ファイルに [タクソノミーを読み込み] アクティビティを追加し、タクソノミー データの出力用の変数を作成します。

[ ドキュメントをデジタル化 ] アクティビティを追加し、[ UiPath Document OCR] を配置します。入力プロパティの [ドキュメント パス ] を指定し、[ ドキュメント テキスト ] および [ドキュメント オブジェクト モデル] の出力変数を作成します。

[UiPath Document OCR] アクティビティに Document Understanding の API キーを追加します。

5. [インテリジェント フォーム抽出器] アクティビティを使用してデータを抽出する

[データ抽出スコープ] アクティビティを追加し、プロパティを入力します。

その中に [ インテリジェント フォーム抽出器 ] をドラッグ アンド ドロップします。このエンドポイントに、インテリジェント フォーム抽出器のエンドポイント ( https://du.uipath.com/svc/intelligentforms) が自動的に入力されます。Document Understanding の API キーを入力します。

その後、新しいテンプレートを作成します。[テンプレートを管理] > [テンプレートを作成] を選択します。ポップアップ ウィンドウが開きます。

[ドキュメントの種類] で前の手順で作成した「W9 (米国の納税申告書)」を選択します。

[ドキュメント名] にテンプレートの名前を入力します。

[テンプレート ドキュメント] (可能な場合はネイティブ PDF)] で、フィールドの位置をマップするテンプレート ドキュメントを添付します。

[ OCR エンジン] で、 もう一度 [UiPath Document OCR] を選択します。前と同様に、エンドポイント、つまり https://du.uipath.com/ocr が自動入力される必要があります。APIキーを指定するだけです。

[ 構成 ] を選択して次の手順に進みます。テンプレート マネージャーのポップアップ ウィンドウが開きます。

ここでは、インテリジェント フォーム抽出器でフィールドを検索する領域を選択する必要があります。詳しい手順については、こちらをご覧ください。フィールドのアンカーを使用することもできます。アンカーについて詳しくは、こちらをご覧ください。

最終的に画面は次のようになります。

[テンプレート マネージャー] で W-9 フォームを示すスクリーンショット

[ 保存] を選択します。この画面では、該当する場合、手書きフィールドまたは署名フィールドを定義できます。Boolean フィールドの類義語を定義することもできます。完了したらウィンドウを閉じます。

[テンプレート マネージャー] を示すスクリーンショット

次に抽出器を設定します。これはつまり、インテリジェント フォーム抽出器がすべての W9 (米国の納税申告書) ドキュメントを処理するように設定するということです。

[抽出器を設定] を示すスクリーンショット

6. 検証ステーションを使用して結果を検証する

抽出結果を検証ステーションで確認するには、[ 検証ステーションを提示] アクティビティをドラッグ アンド ドロップして、入力の詳細を入力します。

[検証ステーションを提示] アクティビティを示すスクリーンショット

7. 抽出結果をエクスポートする

検証済みか否かに関わらず抽出結果をエクスポートするには、[ 抽出結果をエクスポート ] アクティビティをワークフローの最後にドラッグ アンド ドロップします。これにより、複数の表を含む DataSet に結果が出力され、Excel ファイルに書き込んだり下流工程で直接使用したりできます。

[抽出結果をエクスポート] アクティビティを示すスクリーンショット

サンプルをダウンロードする

[インテリジェント フォーム抽出器] アクティビティを使用する W9 (米国の納税申告書) のワークフローを実行するサンプル プロジェクトは、こちらからダウンロードできます。

このページは役に立ちましたか?

接続

ヘルプ リソース サポート

学習する UiPath アカデミー

質問する UiPath フォーラム

最新情報を取得