UiPath Documentation
document-understanding
2023.10
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
UiPath logo, featuring letters U and I in white

Document Understanding ガイド

最終更新日時 2026年4月6日

フォームからデータを抽出する

重要:

The aim of this page is to help first time users get familiar with Document UnderstandingTM.

For scalable production deployments, we strongly recommend using the Document Understanding Process available in UiPath® Studio under the Templates section.

This quickstart guides you through the steps required to extract information from W-9 forms using the Intelligent Form Extractor. The W-9 forms are used as an example, but the procedure is similar for other types of documents where the data is structured.

ゼロから始める場合、以下の手順に従う必要があります。

  1. 空のプロセスを作成する
  2. 必要なアクティビティ パッケージをインストールする
  3. タクソノミーを作成する
  4. ドキュメントをデジタル化する
  5. [インテリジェント フォーム抽出器] アクティビティを使用してデータを抽出する
  6. 検証ステーションを使用して結果を検証する
  7. 抽出結果をエクスポート

1. 空のプロセスを作成する

UiPath Studio を起動します。

In the HOME backstage view, select Process to create a new project.

[新しい空のプロセス] ウィンドウが表示されます。このウィンドウで、新しいプロジェクトの名前を入力します。プロジェクトを簡単に見つけられるように、必要に応じてプロジェクトの説明を追加することもできます。

Select Create. The new project is opened in Studio.

2. 必要なアクティビティ パッケージをインストールする

From the Manage Packages button in the ribbon, besides the core activities packages (UiPath.Excel.Activities,UiPath.Mail.Activities,UiPath.System.Activities,UiPath.UIAutomation.Activities) that are added to the project by default, install the following activities packages:

3. タクソノミーを作成する

アクティビティ パッケージをインストールしたら、必要なフィールドをリストアップします。この例では、以下のフィールドのデータを抽出します。

  • 1_Name - Text
  • 2_BusinessName - Text
  • 3a_Individual - Boolean
  • 3b_CCorp - Boolean
  • 3c_SCorp - Boolean
  • 3d_Partnership - Boolean
  • 3e_TrustEstate - Boolean
  • 3f_LLC - Boolean
  • 3f_LLCTaxClassification - Boolean
  • 3g_Other - Boolean
  • 3g_OtherDetail - Boolean
  • 5_Address - Text
  • 6_CityStateZip - Text
  • 7_AcctNumber - Text
  • TIN_SSN - Text
  • TIN_ETN - Text
  • Certification_Signature - Boolean
  • Certification_SignatureDate - Date

Open Taxonomy Manager and create a group named Structured Documents, a category named Lending Forms, and a document type named W-9. Createlisted fields with user friendly names along with respective data types.

[タクソノミー マネージャー] を示すスクリーンショット

4. ドキュメントをデジタル化する

In the Main.xaml file, add a Load Taxonomy activity and create a variable for the taxonomy output.

Add a Digitize Document activity with UiPath Document OCR. Provide the input property Document Path and create output variables for Document Text and Document Object Model.

[UiPath Document OCR] アクティビティに Document Understanding の API キーを追加します。

5. [インテリジェント フォーム抽出器] アクティビティを使用してデータを抽出する

Add a Data Extraction Scope activity and fill in the properties.

Drag and drop the Intelligent Form Extractor within it. The endpoint should be auto-populated with the Intelligent Form Extractor endpoint, namely https://du.uipath.com/svc/intelligentforms. Provide the Document Understanding API key.

Once that is done, to create a new template, select Manage Templates > Create Template. A pop-up window opens.

[ドキュメントの種類] で前の手順で作成した「W9 (米国の納税申告書)」を選択します。

[ドキュメント名] にテンプレートの名前を入力します。

Under Template document (native PDF if possible), attach a template document where you are going to map the field positions.

Under OCR Engine, select again the UiPath Document OCR. Just like before, the endpoint should be auto-populated, namely https://du.uipath.com/ocr, and you just need to provide the API Key.

Select Configure to move to the next step. The Template Manager pop-up window opens.

Here, we will need to select the areas where we want Intelligent Form Extractor to search for our fields. Configure them by following the steps detailed here. You also have the option of using anchors for your fields. More information on anchors here.

最終的に画面は次のようになります。

[テンプレート マネージャー] で W-9 フォームを示すスクリーンショット

Select Save. In this screen, you can define the handwritten or signature fields, where applicable. You can also define synonyms for Boolean fields. Close the window after you are done.

[テンプレート マネージャー] を示すスクリーンショット

次に抽出器を設定します。これはつまり、インテリジェント フォーム抽出器がすべての W9 (米国の納税申告書) ドキュメントを処理するように設定するということです。

[抽出器を設定] を示すスクリーンショット

6. 検証ステーションを使用して結果を検証する

To check the results through Validation Station, drag and drop the Present Validation Station activity and provide the input details.

[検証ステーションを提示] アクティビティを示すスクリーンショット

7. 抽出結果をエクスポートする

To export the extraction results, validated or not, drag and drop an Export Extraction Results activity to the end of your workflow. This outputs the results into a DataSet that contains multiple tables, which could then be written to an Excel file or be used directly in a downstream process.

[抽出結果をエクスポート] アクティビティを示すスクリーンショット

サンプルをダウンロードする

Download this sample project to execute the W-9 with Intelligent Form Extractor workflow using this link.

このページは役に立ちましたか?

接続

ヘルプ リソース サポート

学習する UiPath アカデミー

質問する UiPath フォーラム

最新情報を取得