- 概要
- Document Understanding Process
- クイック スタート チュートリアル
- 領収書からデータを抽出する
- 請求書のフィールドを 1 つ追加して再トレーニングする
- フォームからデータを抽出する
- フレームワーク コンポーネント
- ML パッケージ
- 概要
- Document Understanding - ML パッケージ
- DocumentClassifier (ドキュメント分類) - ML パッケージ
- OCR 機能を持つ ML パッケージ
- 1040 (米国の個人所得税申告書) - ML パッケージ
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ML パッケージ
- 1040 Schedule D (米国の個人所得税申告書のスケジュール D) - ML パッケージ
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ML パッケージ
- 4506T (米国の納税申告証明依頼書) - ML パッケージ
- 990 (米国の所得税非課税団体申告書) - ML パッケージ (プレビュー)
- ACORD125 (企業向け保険契約申込書) - ML パッケージ
- ACORD126 (企業総合賠償責任保険) - ML パッケージ
- ACORD131 (アンブレラ/エクセス保険) - ML パッケージ
- ACORD140 (商業保険申込書の財物補償条項) - ML パッケージ
- ACORD25 (賠償責任保険証明書) - ML パッケージ
- Bank Statements (銀行預金残高証明書) - ML パッケージ
- BillsOfLading (船荷証券) - ML パッケージ
- Certificate of Incorporation (会社存在証明書) - ML パッケージ
- Certificate of Origin (原産地証明書) - ML パッケージ
- Checks (小切手) - ML パッケージ
- Children's Product Certificate (子供向け製品証明書) - ML パッケージ
- CMS 1500 (米国の医療保険請求フォーム) - ML パッケージ
- EU Declaration of Conformity (EU 適合宣言書) - ML パッケージ
- Financial Statements (財務諸表) - ML パッケージ
- FM1003 (米国の統一住宅ローン申請書) - ML パッケージ
- I9 (米国の就労資格証明書) - ML パッケージ
- ID Cards (ID カード) - ML パッケージ
- Invoices (請求書) - ML パッケージ
- InvoicesAustralia (請求書 - オーストラリア) - ML パッケージ
- InvoicesChina (請求書 - 中国) - ML パッケージ
- InvoicesIndia (請求書 - インド) - ML パッケージ
- InvoicesJapan (請求書 - 日本) - ML パッケージ
- Invoices Shipping (船積送り状) - ML パッケージ
- Packing Lists (梱包明細書) - ML パッケージ
- Passports (パスポート) - ML パッケージ
- Payslips (給与明細) - ML パッケージ
- Purchase Orders (発注書) - ML パッケージ
- Receipts (領収書) - ML パッケージ
- RemittanceAdvices (送金通知書) - ML パッケージ
- UB-04 (健康保険請求フォーム) - ML パッケージ
- Utility Bills (公共料金の請求書) - ML パッケージ
- Vehicle Titles (自動車の権利書) - ML パッケージ
- W2 (米国の源泉徴収票) - ML パッケージ
- W9 (米国の納税申告書) - ML パッケージ
- その他のすぐに使える ML パッケージ
- パブリック エンドポイント
- ハードウェア要件
- パイプライン
- Document Manager
- OCR サービス
- ディープ ラーニング
- Automation Suite にデプロイされた Document Understanding
- インストールして使用する
- 初回の操作
- UiPathDocumentOCR をデプロイする
- すぐに使える ML パッケージをデプロイする
- オフライン バンドル 2023.10.12+patch1
- オフライン バンドル 2023.10.12
- オフライン バンドル 2023.10.11
- オフライン バンドル 2023.10.10
- オフライン バンドル 2023.10.9
- オフライン バンドル 2023.10.8
- オフライン バンドル 2023.10.7+patch1
- オフライン バンドル 2023.10.7
- オフライン バンドル 2023.10.6
- オフライン バンドル 2023.10.5
- オフライン バンドル 2023.10.4
- オフライン バンドル 2023.10.3
- オフライン バンドル 2023.10.2
- オフライン バンドル 2023.10.1
- オフライン バンドル 2023.10.0
- Document Manager を使用する
- フレームワークを使用する
- AI Center スタンドアロンにデプロイされた Document Understanding
- ライセンス
- Activities (アクティビティ)
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities

Document Understanding ガイド
フォームからデータを抽出する
The aim of this page is to help first time users get familiar with Document UnderstandingTM.
For scalable production deployments, we strongly recommend using the Document Understanding Process available in UiPath® Studio under the Templates section.
This quickstart guides you through the steps required to extract information from W-9 forms using the Intelligent Form Extractor. The W-9 forms are used as an example, but the procedure is similar for other types of documents where the data is structured.
ゼロから始める場合、以下の手順に従う必要があります。
- 空のプロセスを作成する
- 必要なアクティビティ パッケージをインストールする
- タクソノミーを作成する
- ドキュメントをデジタル化する
- [インテリジェント フォーム抽出器] アクティビティを使用してデータを抽出する
- 検証ステーションを使用して結果を検証する
- 抽出結果をエクスポート
1. 空のプロセスを作成する
UiPath Studio を起動します。
In the HOME backstage view, select Process to create a new project.
[新しい空のプロセス] ウィンドウが表示されます。このウィンドウで、新しいプロジェクトの名前を入力します。プロジェクトを簡単に見つけられるように、必要に応じてプロジェクトの説明を追加することもできます。
Select Create. The new project is opened in Studio.
2. 必要なアクティビティ パッケージをインストールする
From the Manage Packages button in the ribbon, besides the core activities packages (UiPath.Excel.Activities,UiPath.Mail.Activities,UiPath.System.Activities,UiPath.UIAutomation.Activities) that are added to the project by default, install the following activities packages:
3. タクソノミーを作成する
アクティビティ パッケージをインストールしたら、必要なフィールドをリストアップします。この例では、以下のフィールドのデータを抽出します。
- 1_Name -
Text - 2_BusinessName -
Text - 3a_Individual -
Boolean - 3b_CCorp -
Boolean - 3c_SCorp -
Boolean - 3d_Partnership -
Boolean - 3e_TrustEstate -
Boolean - 3f_LLC -
Boolean - 3f_LLCTaxClassification -
Boolean - 3g_Other -
Boolean - 3g_OtherDetail -
Boolean - 5_Address -
Text - 6_CityStateZip -
Text - 7_AcctNumber -
Text - TIN_SSN -
Text - TIN_ETN -
Text - Certification_Signature -
Boolean - Certification_SignatureDate -
Date
Open Taxonomy Manager and create a group named Structured Documents, a category named Lending Forms, and a document type named W-9. Createlisted fields with user friendly names along with respective data types.
![[タクソノミー マネージャー] を示すスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-describing-the-taxonomy-manager-114624-8280ca02-3e84bbab.webp)
4. ドキュメントをデジタル化する
In the Main.xaml file, add a Load Taxonomy activity and create a variable for the taxonomy output.
Add a Digitize Document activity with UiPath Document OCR. Provide the input property Document Path and create output variables for Document Text and Document Object Model.
[UiPath Document OCR] アクティビティに Document Understanding の API キーを追加します。
5. [インテリジェント フォーム抽出器] アクティビティを使用してデータを抽出する
Add a Data Extraction Scope activity and fill in the properties.
Drag and drop the Intelligent Form Extractor within it. The endpoint should be auto-populated with the Intelligent Form Extractor endpoint, namely https://du.uipath.com/svc/intelligentforms. Provide the Document Understanding API key.
Once that is done, to create a new template, select Manage Templates > Create Template. A pop-up window opens.
[ドキュメントの種類] で前の手順で作成した「W9 (米国の納税申告書)」を選択します。
[ドキュメント名] にテンプレートの名前を入力します。
Under Template document (native PDF if possible), attach a template document where you are going to map the field positions.
Under OCR Engine, select again the UiPath Document OCR. Just like before, the endpoint should be auto-populated, namely https://du.uipath.com/ocr, and you just need to provide the API Key.
Select Configure to move to the next step. The Template Manager pop-up window opens.
Here, we will need to select the areas where we want Intelligent Form Extractor to search for our fields. Configure them by following the steps detailed here. You also have the option of using anchors for your fields. More information on anchors here.
最終的に画面は次のようになります。
![[テンプレート マネージャー] で W-9 フォームを示すスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-describing-a-w-9-form-in-template-manager-117221-d2fe481f-76ffd47b.webp)
Select Save. In this screen, you can define the handwritten or signature fields, where applicable. You can also define synonyms for Boolean fields. Close the window after you are done.
![[テンプレート マネージャー] を示すスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-describing-the-template-manager-119457-551a0776-08106c56.webp)
次に抽出器を設定します。これはつまり、インテリジェント フォーム抽出器がすべての W9 (米国の納税申告書) ドキュメントを処理するように設定するということです。
![[抽出器を設定] を示すスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-describing-the-configure-extractors-119784-d6122f47-6312bc3e.webp)
6. 検証ステーションを使用して結果を検証する
To check the results through Validation Station, drag and drop the Present Validation Station activity and provide the input details.
![[検証ステーションを提示] アクティビティを示すスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-describing-the-present-validation-station-activity-115935-2b9c0d4f-dd3c1c8b.webp)
7. 抽出結果をエクスポートする
To export the extraction results, validated or not, drag and drop an Export Extraction Results activity to the end of your workflow. This outputs the results into a DataSet that contains multiple tables, which could then be written to an Excel file or be used directly in a downstream process.
![[抽出結果をエクスポート] アクティビティを示すスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-describing-the-export-extraction-results-activity-117363-b40cde11-88f91533.webp)
サンプルをダウンロードする
Download this sample project to execute the W-9 with Intelligent Form Extractor workflow using this link.