- 概要
- 基本情報
- アクティビティ
- Insights のダッシュボード
- Document Understanding Process
- クイック スタート チュートリアル
- フレームワーク コンポーネント
- ML パッケージ
- 概要
- Document Understanding - ML パッケージ
- DocumentClassifier (ドキュメント分類) - ML パッケージ
- OCR 機能を持つ ML パッケージ
- 1040 (米国の個人所得税申告書) - ML パッケージ
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ML パッケージ
- 1040 Schedule D (米国の個人所得税申告書のスケジュール D) - ML パッケージ
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ML パッケージ
- 1040x (米国の個人所得税修正申告書) - ML パッケージ
- 3949a - ML パッケージ
- 4506T (米国の納税申告証明依頼書) - ML パッケージ
- 709 (米国の贈与税申告書) - ML パッケージ
- 941x (米国の雇用主による四半期連邦税修正申告書) - ML パッケージ
- 9465 (米国の分割納付申請書) - ML パッケージ
- ACORD131 (アンブレラ/エクセス保険) - ML パッケージ
- ACORD140 (商業保険申込書の財物補償条項) - ML パッケージ
- ACORD25 (賠償責任保険証明書) - ML パッケージ
- Bank Statements (銀行預金残高証明書) - ML パッケージ
- BillsOfLading (船荷証券) - ML パッケージ
- Certificate of Incorporation (会社存在証明書) - ML パッケージ
- Certificate of Origin (原産地証明書) - ML パッケージ
- Checks (小切手) - ML パッケージ
- Children's Product Certificate (子供向け製品証明書) - ML パッケージ
- CMS 1500 (米国の医療保険請求フォーム) - ML パッケージ
- EU Declaration of Conformity (EU 適合宣言書) - ML パッケージ
- Financial Statements (財務諸表) - ML パッケージ
- FM1003 (米国の統一住宅ローン申請書) - ML パッケージ
- I9 (米国の就労資格証明書) - ML パッケージ
- ID Cards (ID カード) - ML パッケージ
- Invoices (請求書) - ML パッケージ
- InvoicesAustralia (請求書 - オーストラリア) - ML パッケージ
- InvoicesChina (請求書 - 中国) - ML パッケージ
- Invoices Hebrew (請求書 - ヘブライ語) - ML パッケージ
- InvoicesIndia (請求書 - インド) - ML パッケージ
- InvoicesJapan (請求書 - 日本) - ML パッケージ
- Invoices Shipping (船積送り状) - ML パッケージ
- Packing Lists (梱包明細書) - ML パッケージ
- Payslips (給与明細) - ML パッケージ
- Passports (パスポート) - ML パッケージ
- Purchase Orders (発注書) - ML パッケージ
- Receipts (領収書) - ML パッケージ
- RemittanceAdvices (送金通知書) - ML パッケージ
- UB-04 (健康保険請求フォーム) - ML パッケージ
- Utility Bills (公共料金の請求書) - ML パッケージ
- Vehicle Titles (自動車の権利書) - ML パッケージ
- W2 (米国の源泉徴収票) - ML パッケージ
- W9 (米国の納税申告書) - ML パッケージ
- その他のすぐに使える ML パッケージ
- パブリック エンドポイント
- トラフィック制限
- OCR の設定
- パイプライン
- OCR サービス
- サポートされている言語
- ディープ ラーニング
- ライセンス
Document Understanding ガイド
領収書からデータを抽出する
このページは、UiPath® Document UnderstandingTM を初めて使用するユーザーに Document Understanding の機能を分かりやすく紹介するためのページです。
運用環境へのスケーラブルなデプロイを実現するには、UiPath® Studio の [テンプレート] セクションにある Document Understanding Process を使用することを強くお勧めします。
このクイックスタート チュートリアルでは、すぐに使える ML モデル「Receipts (領収書)」と対応するパブリック エンドポイントを使用して、領収書からデータを抽出する方法を説明します。
抽出結果の検証は、検証ステーションを提示するか、Action Center で検証アクションを使用して行うことができます。どちらのオプションについても、以降のセクションで説明します。
このセクションでは、検証ステーションを使用して抽出結果を検証します。
ML モデル「Receipts (領収書)」を使用して基本的なワークフローを作成するには、以下の手順を実行します。
- 空のプロセスを作成する
- 必要なアクティビティ パッケージをインストールする
- タクソノミーを作成する
- ドキュメントをデジタル化する
- ML モデル「Receipts (領収書)」を使用してデータを抽出する
- 検証ステーションを使用して結果を検証する
- 抽出結果をエクスポートする
次に、各ステップについて詳しく説明します。
- UiPath Studio を起動します。
- [ホーム] の Backstage ビューで [プロセス] をクリックして、新しいプロジェクトを作成します。
- [新しい空のプロセス] ウィンドウが表示されます。このウィンドウで、新しいプロジェクトの名前を入力します。プロジェクトを簡単に見つけられるように、必要に応じてプロジェクトの説明を追加することもできます。
- [作成] をクリックします。新しいプロジェクトが Studio で開きます。
既定でプロジェクトに追加されるコア アクティビティ パッケージ (UiPath.Excel.Activities、UiPath.Mail.Activities、UiPath.System.Activities、UiPath.UIAutomation.Activities) に加えて、リボンの [パッケージを管理] ボタンから、次のアクティビティ パッケージをインストールします。
アクティビティ パッケージをインストールしたら、必要なフィールドをリストアップします。ML モデル「Receipts (領収書)」は、以下のフィールドのデータ抽出をサポートしています。
- name -
Text
- vendor-addr -
Address
- total -
Number
- date -
Date
- phone -
Text
- currency -
Text
- expense-type -
Text
- items -
Table
- description -
Text
- line-amount -
Number
- unit-price -
Number
- quantity -
Number
- description -
[タクソノミー マネージャー] を開き、「Semi Structured Documents (半構造化されたドキュメント)」という名前のグループ、「Finance (財務)」という名前のカテゴリ、「Receipts (領収書)」という名前のドキュメントの種類を作成します。先ほどリストアップしたフィールドを、それぞれのデータ型とともに分かりやすい名前で作成します。
- Main.xaml ファイルに [タクソノミーを読み込み] アクティビティを追加し、タクソノミー データの出力用の変数を作成します。
- [ドキュメントをデジタル化] アクティビティを追加し、[UiPath Document OCR] を配置します。入力プロパティの [ドキュメント パス] を指定し、[ドキュメント テキスト] および [ドキュメント オブジェクト モデル] の出力変数を作成します。
- [UiPath Document OCR] アクティビティに Document Understanding の API キーを追加します。
- [データ抽出スコープ] アクティビティを追加し、プロパティを入力します。
- [マシン ラーニング抽出器] アクティビティをドラッグ アンド ドロップします。[エンドポイント]、[ML スキル]、[API キー] の 3 つの入力パラメーターを含むポップアップが画面に表示されます。
- [エンドポイント] パラメーターに Receipts (領収書) のパブリック エンドポイント、つまり
https://du.uipath.com/ie/receipts
を入力し、Document Understanding の API キーを入力します。 - [機能を取得] をクリックします。
- 次に、抽出器を設定します。以下の画像のように、タクソノミー マネージャーで作成したフィールドを ML モデルで使用可能なフィールドにマッピングします。
- ML スキルを使用して [マシン ラーニング抽出器] アクティビティを使用するには、ドロップダウンから ML スキルを選択して抽出器を設定します。
- お使いの ML スキルがあるテナントにロボットが接続されている必要があります。
抽出結果を検証ステーションで確認するには、[検証ステーションを提示] アクティビティをドラッグ アンド ドロップして、入力の詳細を入力します。
DataSet
に結果が出力されます。この出力には複数の表が含まれており、Excel ファイルに書き込んだり下流工程で直接使用したりできます。
このサンプル プロジェクトはこちらからダウンロードできます。
この例には、次の 2 つのワークフローが含まれます。
- Main.xaml - このワークフローでは、検証ステーションを使用して抽出結果が検証されます。これは、前述のセクションで説明したワークフローです。
- Main - Unattended.xaml - このワークフローでは、検証アクションを使用して抽出結果が検証されます。このワークフローについては、以降のセクションで説明します。
次に、検証ステーションを提示する代わりに Action Center の検証アクションを使用する方法を見てみましょう。
UiPath Action Center を使用すると、承認、権限の変更、例外対応などの人間が行うべき意思決定がオートメーションに含まれる場合に、プロセスをロボットから人間に簡単かつ効率的に引き渡し、その後再びロボットに返すことができます。
Document Understanding の Action Center アクティビティには、 UiPath.IntelligentOCR.Activities パッケージと UiPath.Persistance.Activities パッケージがあります。UiPath Studio の [プロジェクト設定] > [全般] にある [永続性をサポート] オプションを必ず有効化してください。
ドキュメントの検証アクションを Action Center に追加するオーケストレーション プロセスをオンプレミス版 Orchestrator と Automation Cloud の両方で追加すると、生産性を向上できます。この操作により、ドキュメントをローカルに保存したり、人間が操作する各マシンに Robot をインストールしたり、人間のユーザーが検証を完了するのをロボットに待機させたりする必要がなくなります。
詳しくは、こちらをご覧ください。
上記のセクションで説明した手順 1 から 5 を繰り返します。
その後、[検証ステーションを提示] アクティビティを使用する代わりに、[ドキュメント検証アクションを作成] アクティビティと [ドキュメント検証アクション完了まで待機し再開] アクティビティを使用します。
以下の画像は、[ドキュメント検証アクションを作成] アクティビティとそのプロパティです。
このアクティビティにより、Action Center 内にドキュメント検証アクションが作成されます。[ドキュメント検証アクションを作成] アクティビティの出力結果は、その後 [ドキュメント検証アクション完了まで待機し再開] アクティビティで使用できます。これにより、オーケストレーション ワークフローを中断して、Action Center での人間のアクションが完了した時に再開するようにできます。
- パブリック エンドポイントと検証ステーションを使用して ML モデル「Receipts (領収書)」を使用する
- 1. 空のプロセスを作成する
- 2. 必要なアクティビティ パッケージをインストールする
- 3. タクソノミーを作成する
- 4. ドキュメントをデジタル化する
- 5. ML モデル「Receipts (領収書)」を使用してデータを抽出する
- 6. 検証ステーションを使用して結果を検証する
- 7. 抽出結果をエクスポートする
- サンプルをダウンロードする
- パブリック エンドポイントと検証アクションを使用して ML モデル「Receipts (領収書)」を使用する
- Action Center 内のタスクについて
- 検証アクションについて
- 検証アクションの使用方法