Document Understanding
2022.10
バナーの背景画像
Document Understanding ガイド
最終更新日 2024年4月19日

領収書からデータを抽出する

重要:

このページは、Document Understanding を初めて使用するユーザーに Document Understanding の機能を分かりやすく紹介するためのページです。

運用環境へのスケーラブルなデプロイを実現するには、UiPath Studio の [テンプレート] セクションにある Document Understanding Process を使用することを強くお勧めします。

このクイックスタート チュートリアルでは、すぐに使える ML モデル「Receipts (領収書)」と対応するパブリック エンドポイントを使用して、領収書からデータを抽出する方法を説明します。

抽出結果の検証は、検証ステーションを提示するか、Action Center で検証アクションを使用して行うことができます。どちらのオプションについても、以降のセクションで説明します。

パブリック エンドポイントと検証ステーションを使用して ML モデル「Receipts (領収書)」を使用する

このセクションでは、検証ステーションを使用して抽出結果を検証します。

ML モデル「Receipts (領収書)」を使用して基本的なワークフローを作成するには、以下の手順を実行します。

  1. 空のプロセスを作成する
  2. 必要なアクティビティ パッケージをインストールする
  3. タクソノミーを作成する
  4. ドキュメントをデジタル化する
  5. ML モデル「Receipts (領収書)」を使用してデータを抽出する
  6. 検証ステーションを使用して結果を検証する
  7. 抽出結果をエクスポートする

次に、各ステップについて詳しく説明します。

1. 空のプロセスを作成する

UiPath Studio を起動します。

[ホーム] の Backstage ビューで [プロセス] をクリックして、新しいプロジェクトを作成します。

[新しい空のプロセス] ウィンドウが表示されます。このウィンドウで、新しいプロジェクトの名前を入力します。プロジェクトを簡単に見つけられるように、必要に応じてプロジェクトの説明を追加することもできます。

[作成] をクリックします。新しいプロジェクトが Studio で開きます。

2. 必要なアクティビティ パッケージをインストールする

既定でプロジェクトに追加されるコア アクティビティ パッケージ (UiPath.Excel.ActivitiesUiPath.Mail.ActivitiesUiPath.System.ActivitiesUiPath.UIAutomation.Activities) に加えて、リボンの [パッケージを管理] ボタンから、次のアクティビティ パッケージをインストールします。

3. タクソノミーを作成する

アクティビティ パッケージをインストールしたら、必要なフィールドをリストアップします。ML モデル「Receipts (領収書)」は、以下のフィールドのデータ抽出をサポートしています。

  • name - Text
  • vendor-addr - Address
  • total - Number
  • date - Date
  • phone - Text
  • currency - Text
  • expense-type - Text
  • items - Table
    • description - Text
    • line-amount - Number
    • unit-price - Number
    • quantity - Number

[タクソノミー マネージャー] を開き、「Semi Structured Documents (半構造化されたドキュメント)」という名前のグループ、「Finance (財務)」という名前のカテゴリ、「Receipts (領収書)」という名前のドキュメントの種類を作成します。先ほどリストアップしたフィールドを、それぞれのデータ型とともに分かりやすい名前で作成します。



4. ドキュメントをデジタル化する

Main.xaml ファイルに [タクソノミーを読み込み] アクティビティを追加し、タクソノミー データの出力用の変数を作成します。

[ドキュメントをデジタル化] アクティビティを追加し、[UiPath ドキュメント OCR] を配置します。入力プロパティの [ドキュメント パス] を指定し、[ドキュメント テキスト] および [ドキュメント オブジェクト モデル] の出力変数を作成します。

[UiPath ドキュメント OCR] アクティビティに Document Understanding の API キーを追加します。

5. ML モデル「Receipts (領収書)」を使用してデータを抽出する

[データ抽出スコープ] アクティビティを追加し、プロパティを入力します。

[マシン ラーニング抽出器] アクティビティをドラッグ アンド ドロップします。[エンドポイント][ML スキル][API キー] の 3 つの入力パラメーターを含むポップアップが画面に表示されます。

[エンドポイント] パラメーターに Receipts (領収書) のパブリック エンドポイント、つまり https://du.uipath.com/ie/receipts を入力し、Document Understanding の API キーを入力します。

[機能を取得] をクリックします。

次に、抽出器を設定します。以下の画像のように、タクソノミー マネージャーで作成したフィールドを ML モデルで使用可能なフィールドにマッピングします。



ML スキルを使用して [マシン ラーニング抽出器] アクティビティを使用するには、ドロップダウンから ML スキルを選択して抽出器を設定します。

お使いの ML スキルがあるテナントにロボットが接続されている必要があります。



6. 検証ステーションを使用して結果を検証する

抽出結果を検証ステーションで確認するには、[検証ステーションを提示] アクティビティをドラッグ アンド ドロップして、入力の詳細を入力します。



7. 抽出結果をエクスポートする

抽出結果をエクスポートするには、[抽出結果をエクスポート] アクティビティをワークフローの最後にドラッグ アンド ドロップします。これにより、DataSet に結果が出力されます。この出力には複数の表が含まれており、Excel ファイルに書き込んだり下流工程で直接使用したりできます。


サンプルをダウンロードする

このサンプル プロジェクトはこちらからダウンロードできます。

この例には、次の 2 つのワークフローが含まれます。

  • Main.xaml - このワークフローでは、検証ステーションを使用して抽出結果が検証されます。これは、前述のセクションで説明したワークフローです。
  • Main - Unattended.xaml - このワークフローでは、検証アクションを使用して抽出結果が検証されます。このワークフローについては、以降のセクションで説明します。

パブリック エンドポイントと検証アクションを使用して ML モデル「Receipts (領収書)」を使用する

次に、検証ステーションを提示する代わりに Action Center の検証アクションを使用する方法を見てみましょう。

Action Center 内のタスクについて

UiPath Action Center を使用すると、承認、権限の変更、例外対応などの人間が行うべき意思決定がオートメーションに含まれる場合に、プロセスをロボットから人間に簡単かつ効率的に引き渡し、その後再びロボットに返すことができます。

Document Understanding の Action Center アクティビティには、 UiPath.IntelligentOCR.Activities パッケージと UiPath.Persistance.Activities パッケージがあります。UiPath Studio の [プロジェクト設定] > [全般] にある [永続性をサポート] オプションを必ず有効化してください。



検証アクションについて

ドキュメントの検証アクションを Action Center に追加するオーケストレーション プロセスをオンプレミス版 Orchestrator と Automation Cloud の両方で追加すると、生産性を向上できます。この操作により、ドキュメントをローカルに保存したり、人間が操作する各マシンに Robot をインストールしたり、人間のユーザーが検証を完了するのをロボットに待機させたりする必要がなくなります。

詳しくは、こちらをご覧ください。

検証アクションの使用方法

上記のセクションで説明した手順 1 から 5 を繰り返します。

その後、[検証ステーションを提示] アクティビティを使用する代わりに、[ドキュメント検証アクションを作成] アクティビティと [ドキュメント検証アクション完了まで待機し再開] アクティビティを使用します。

以下の画像は、[ドキュメント検証アクションを作成] アクティビティとそのプロパティです。



このアクティビティにより、Action Center 内にドキュメント検証アクションが作成されます。[ドキュメント検証アクションを作成] アクティビティの出力結果は、その後 [ドキュメント検証アクション完了まで待機し再開] アクティビティで使用できます。これにより、オーケストレーション ワークフローを中断して、Action Center での人間のアクションが完了した時に再開するようにできます。

Was this page helpful?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
UiPath ロゴ (白)
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.