- 概要
- Document Understanding Process
- クイック スタート チュートリアル
- 領収書からデータを抽出する
- 請求書のフィールドを 1 つ追加して再トレーニングする
- フォームからデータを抽出する
- フレームワーク コンポーネント
- ML パッケージ
- 概要
- Document Understanding - ML パッケージ
- DocumentClassifier (ドキュメント分類) - ML パッケージ
- OCR 機能を持つ ML パッケージ
- 1040 (米国の個人所得税申告書) - ML パッケージ
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ML パッケージ
- 1040 Schedule D (米国の個人所得税申告書のスケジュール D) - ML パッケージ
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ML パッケージ
- 1040x (米国の個人所得税修正申告書) - ML パッケージ
- 3949a - ML パッケージ
- 4506T (米国の納税申告証明依頼書) - ML パッケージ
- 709 (米国の贈与税申告書) - ML パッケージ
- 941x (米国の雇用主による四半期連邦税修正申告書) - ML パッケージ
- 9465 (米国の分割納付申請書) - ML パッケージ
- 990 (米国の所得税非課税団体申告書) - ML パッケージ (プレビュー)
- ACORD125 (企業向け保険契約申込書) - ML パッケージ
- ACORD126 (企業総合賠償責任保険) - ML パッケージ
- ACORD131 (アンブレラ/エクセス保険) - ML パッケージ
- ACORD140 (商業保険申込書の財物補償条項) - ML パッケージ
- ACORD25 (賠償責任保険証明書) - ML パッケージ
- Bank Statements (銀行預金残高証明書) - ML パッケージ
- BillsOfLading (船荷証券) - ML パッケージ
- Certificate of Incorporation (会社存在証明書) - ML パッケージ
- Certificate of Origin (原産地証明書) - ML パッケージ
- Checks (小切手) - ML パッケージ
- Children's Product Certificate (子供向け製品証明書) - ML パッケージ
- CMS 1500 (米国の医療保険請求フォーム) - ML パッケージ
- EU Declaration of Conformity (EU 適合宣言書) - ML パッケージ
- Financial Statements (財務諸表) - ML パッケージ
- FM1003 (米国の統一住宅ローン申請書) - ML パッケージ
- I9 (米国の就労資格証明書) - ML パッケージ
- ID Cards (ID カード) - ML パッケージ
- Invoices (請求書) - ML パッケージ
- InvoicesChina (請求書 - 中国) - ML パッケージ
- Invoices Hebrew (請求書 - ヘブライ語) - ML パッケージ
- InvoicesIndia (請求書 - インド) - ML パッケージ
- InvoicesJapan (請求書 - 日本) - ML パッケージ
- Invoices Shipping (船積送り状) - ML パッケージ
- Packing Lists (梱包明細書) - ML パッケージ
- Passports (パスポート) - ML パッケージ
- Payslips (給与明細) - ML パッケージ
- Purchase Orders (発注書) - ML パッケージ
- Receipts (領収書) - ML パッケージ
- RemittanceAdvices (送金通知書) - ML パッケージ
- UB-04 (健康保険請求フォーム) - ML パッケージ
- Utility Bills (公共料金の請求書) - ML パッケージ
- Vehicle Titles (自動車の権利書) - ML パッケージ
- W2 (米国の源泉徴収票) - ML パッケージ
- W9 (米国の納税申告書) - ML パッケージ
- その他のすぐに使える ML パッケージ
- パブリック エンドポイント
- ハードウェア要件
- パイプライン
- Document Manager
- OCR サービス
- サポートされている言語
- ディープ ラーニング
- Insights のダッシュボード
- Automation Suite にデプロイされた Document Understanding
- AI Center スタンドアロンにデプロイされた Document Understanding
- ライセンス
- Activities (アクティビティ)
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities

Document Understanding ガイド
領収書からデータを抽出する
The aim of this page is to help first time users get familiar with UiPath® Document UnderstandingTM.
For scalable production deployments, we strongly recommend using the Document Understanding Process available in UiPath® Studio under the Templates section.
このクイックスタート チュートリアルでは、すぐに使える ML モデル「Receipts (領収書)」と対応するパブリック エンドポイントを使用して、領収書からデータを抽出する方法を説明します。
抽出結果の検証は、検証ステーションを提示するか、Action Center で検証アクションを使用して行うことができます。どちらのオプションについても、以降のセクションで説明します。
パブリック エンドポイントと検証ステーションを使用して ML モデル「Receipts (領収書)」を使用する
このセクションでは、検証ステーションを使用して抽出結果を検証します。
To create a basic workflow using the Receipts ML Model, use the following steps:
- 空のプロセスを作成する
- 必要なアクティビティ パッケージをインストールする
- タクソノミーを作成する
- ドキュメントをデジタル化する
- ML モデル「Receipts (領収書)」を使用してデータを抽出する
- 検証ステーションを使用して結果を検証する
- 抽出結果をエクスポートする
1. 空のプロセスを作成する
- UiPath Studio を起動します。
- In the HOME backstage view, select Process to create a new project.
- [新しい空のプロセス] ウィンドウが表示されます。このウィンドウで、新しいプロジェクトの名前を入力します。プロジェクトを簡単に見つけられるように、必要に応じてプロジェクトの説明を追加することもできます。
- Select Create. The new project is opened in Studio.
2. 必要なアクティビティ パッケージをインストールする
From the Manage Packages button in the ribbon, besides the core activities packages (UiPath.Excel.Activities, UiPath.Mail.Activities, UiPath.System.Activities, UiPath.UIAutomation.Activities) that are added to the project by default, install the following activities packages:
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer
- UiPath.IntelligentOCR.Activities
- UiPath.MLServices.Activities
3. タクソノミーを作成する
Once the activities packages are installed, list out the required fields. The Receipts ML model supports data extraction for the following fields:
- name -
Text - vendor-addr -
Address - total -
Number - date -
Date - phone -
Text - currency -
Text - expense-type -
Text - items -
Table- description -
Text - line-amount -
Number - unit-price -
Number - quantity -
Number
- description -
Open Taxonomy Manager and create a group named Semi Structured Documents, a category named Finance, and a document type named Receipts. Create the listed fields with user friendly names along with respective data types.
![[タクソノミー マネージャー] を示すスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-describing-the-taxonomy-manager-116211-85b42624-9d0bf377.webp)
4. ドキュメントをデジタル化する
- In the Main.xaml file, add a Load Taxonomy activity and create a variable for the taxonomy output.
- Add a Digitize Document activity with UiPath Document OCR. Provide the input property Document Path and create output variables for Document Text and Document Object Model.
- [UiPath Document OCR] アクティビティに Document Understanding の API キーを追加します。
5. ML モデル「Receipts (領収書)」を使用してデータを抽出する
- Add a Data Extraction Scope activity and fill in the properties.
- Drag and drop a Machine Learning Extractor activity. A pop-up with three input parameters, Endpoint, ML Skill, and ApiKey, is displayed on the screen.
- Fill in the Endpoint parameter with the Receipts Public Endpoint, namely
https://du.uipath.com/ie/receipts, and provide the Document Understanding API key. - Select Get Capabilities.
- The next step is to configure the extractor. Configuring the extractor means mapping the fields that you created in Taxonomy Manager to the fields available in the ML model.
![[抽出器を設定] ダイアログを示すスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-describing-the-configure-extractor-dialog-114156-6ffb7c4d-8d3a79c2.webp)
- ML スキルを使用して [マシン ラーニング抽出器] アクティビティを使用するには、ドロップダウンから ML スキルを選択して抽出器を設定します。
- お使いの ML スキルがあるテナントにロボットが接続されている必要があります。
![[マシン ラーニング抽出器] ダイアログの [ML スキル] ドロップダウンを示すスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-describing-the-machine-learning-extractor-dialog-ml-skill-drop-down-115146-cca7706d-f4bf7162.webp)
6. 検証ステーションを使用して結果を検証する
To check the results through Validation Station, drag and drop the Present Validation Station activity and provide the input details.
![[検証ステーションを提示] アクティビティを示すスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-describing-the-present-validation-station-activity-116107-b47298ad-32581a01.webp)
7. 抽出結果をエクスポートする
To export the extraction results, drag and drop an Export Extraction Results activity to the end of your workflow. This outputs the results into a DataSet that contains multiple tables, which could then be written to an Excel file or be used directly in a downstream process.
![[抽出結果をエクスポート] アクティビティを示すスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-describing-the-export-extraction-results-activity-116203-67fad58b-5c3d5719.webp)
サンプルをダウンロードする
Download this sample project using this link.
この例には、次の 2 つのワークフローが含まれます。
- Main.xaml - in this workflow, the extraction results are validated using Validation Station
- Main - Unattended.xaml - このワークフローでは、検証アクションを使用して抽出結果が検証されます。このワークフローについては、以降のセクションで説明します。
パブリック エンドポイントと検証アクションを使用して ML モデル「Receipts (領収書)」を使用する
検証ステーションを表示する代わりに Action Center の検証アクションを使用する方法の詳細については、このページをご覧ください。
Action Center 内のタスクについて
UiPath Action Center を使用すると、承認、権限の変更、例外対応などの人間が行うべき意思決定がオートメーションに含まれる場合に、プロセスをロボットから人間に簡単かつ効率的に引き渡し、その後再びロボットに返すことができます。
Document Understanding の Action Center アクティビティには、 UiPath.IntelligentOCR.Activities パッケージと UiPath.Persistance.Activities パッケージがあります。UiPath Studio の [プロジェクト設定] > [全般] にある [永続性をサポート] オプションを必ず有効化してください。
![[プロジェクト設定] インターフェイスを示すスクリーンショット。[永続性をサポート] トグル ボタンが強調表示されています。](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-describing-the-project-settings-interface-with-the-supports-persistence-toggle-button-highlighted-116412-384d1f4a-3fe84fea.webp)
検証アクションについて
ドキュメントの検証アクションを Action Center に追加するオーケストレーション プロセスをオンプレミス版 Orchestrator と Automation Cloud の両方で追加すると、生産性を向上できます。この操作により、ドキュメントをローカルに保存したり、人間が操作する各マシンに Robot をインストールしたり、人間のユーザーが検証を完了するのをロボットに待機させたりする必要がなくなります。
More details here.
検証アクションの使用方法
上記のセクションで説明した手順 1 から 5 を繰り返します。
Then, instead of using the Present Validation Station activity, use the Create Document Validation Action and Wait for Document Validation Action and Resume activities.
![[ドキュメント検証アクションを作成] アクティビティを示すスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-describing-the-create-document-validation-action-activity-116471-817361e2-1ba4e480.webp)
This creates a document validation action in Action Center. The output of the Create Document Validation Action activity can then be used with the Wait for Document Validation Action and Resume activity to suspend and resume orchestration workflows upon human action completion in Action Center.
- パブリック エンドポイントと検証ステーションを使用して ML モデル「Receipts (領収書)」を使用する
- 1. 空のプロセスを作成する
- 2. 必要なアクティビティ パッケージをインストールする
- 3. タクソノミーを作成する
- 4. ドキュメントをデジタル化する
- 5. ML モデル「Receipts (領収書)」を使用してデータを抽出する
- 6. 検証ステーションを使用して結果を検証する
- 7. 抽出結果をエクスポートする
- サンプルをダウンロードする
- パブリック エンドポイントと検証アクションを使用して ML モデル「Receipts (領収書)」を使用する
- Action Center 内のタスクについて
- 検証アクションについて
- 検証アクションの使用方法