document-understanding

2022.4

true

重要 :

このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。新しいコンテンツの翻訳は、およそ 1 ～ 2 週間で公開されます。

Document Understanding ガイド

デリバリー:

最終更新日時 2025年4月4日

領収書からデータを抽出する

重要:

このページは、Document Understanding を初めて使用するユーザーに Document Understanding の機能を分かりやすく紹介するためのページです。

運用環境へのスケーラブルなデプロイを実現するには、UiPath Studio の [テンプレート] セクションにある Document Understanding Process を使用することを強くお勧めします。

このクイックスタートチュートリアルでは、すぐに使える ML モデル「Receipts (領収書)」と対応するパブリックエンドポイントを使用して、領収書からデータを抽出する方法を説明します。

抽出結果の検証は、検証ステーションを提示するか、Action Center で検証アクションを使用して行うことができます。どちらのオプションについても、以降のセクションで説明します。

パブリックエンドポイントと検証ステーションを使用して ML モデル「Receipts (領収書)」を使用する

このセクションでは、検証ステーションを使用して抽出結果を検証します。

ML モデル「Receipts (領収書)」を使用して基本的なワークフローを作成するには、以下の手順を実行します。

空のプロセスを作成する
必要なアクティビティパッケージをインストールする
タクソノミーを作成する
ドキュメントをデジタル化する
ML モデル「Receipts (領収書)」を使用してデータを抽出する
検証ステーションを使用して結果を検証する
抽出結果をエクスポートする

次に、各ステップについて詳しく説明します。

1. 空のプロセスを作成する

UiPath Studio を起動します。

[ホーム] の Backstage ビューで [プロセス] をクリックして、新しいプロジェクトを作成します。

[新しい空のプロセス] ウィンドウが表示されます。このウィンドウで、新しいプロジェクトの名前を入力します。プロジェクトを簡単に見つけられるように、必要に応じてプロジェクトの説明を追加することもできます。

[作成] をクリックします。新しいプロジェクトが Studio で開きます。

2. 必要なアクティビティパッケージをインストールする

既定でプロジェクトに追加されるコアアクティビティパッケージ (UiPath.Excel.Activities、UiPath.Mail.Activities、UiPath.System.Activities、UiPath.UIAutomation.Activities) に加えて、リボンの [パッケージを管理] ボタンから、次のアクティビティパッケージをインストールします。

3. タクソノミーを作成する

アクティビティパッケージをインストールしたら、必要なフィールドをリストアップします。ML モデル「Receipts (領収書)」は、以下のフィールドのデータ抽出をサポートしています。

name - Text
vendor-addr - Address
total - Number
date - Date
phone - Text
currency - Text
expense-type - Text
items - Table
- description - Text
- line-amount - Number
- unit-price - Number
- quantity - Number

[タクソノミーマネージャー] を開き、「Semi Structured Documents (半構造化されたドキュメント)」という名前のグループ、「Finance (財務)」という名前のカテゴリ、「Receipts (領収書)」という名前のドキュメントの種類を作成します。先ほどリストアップしたフィールドを、それぞれのデータ型とともに分かりやすい名前で作成します。

4. ドキュメントをデジタル化する

Main.xaml ファイルに [タクソノミーを読み込み] アクティビティを追加し、タクソノミーデータの出力用の変数を作成します。

[ドキュメントをデジタル化] アクティビティを追加し、[UiPath Document OCR] を配置します。入力プロパティの [ドキュメントパス] を指定し、[ドキュメントテキスト] および [ドキュメントオブジェクトモデル] の出力変数を作成します。

[UiPath Document OCR] アクティビティに Document Understanding の API キーを追加します。

5. ML モデル「Receipts (領収書)」を使用してデータを抽出する

[データ抽出スコープ] アクティビティを追加し、プロパティを入力します。

[マシンラーニング抽出器] アクティビティをドラッグアンドドロップします。[エンドポイント]、[ML スキル]、[API キー] の 3 つの入力パラメーターを含むポップアップが画面に表示されます。

[エンドポイント] パラメーターに Receipts (領収書) のパブリックエンドポイント、つまり https://du.uipath.com/ie/receipts を入力し、Document Understanding の API キーを入力します。

[機能を取得] をクリックします。

次に、抽出器を設定します。以下の画像のように、タクソノミーマネージャーで作成したフィールドを ML モデルで使用可能なフィールドにマッピングします。

ML スキルを使用して [マシンラーニング抽出器] アクティビティを使用するには、ドロップダウンから ML スキルを選択して抽出器を設定します。

お使いの ML スキルがあるテナントにロボットが接続されている必要があります。

6. 検証ステーションを使用して結果を検証する

抽出結果を検証ステーションで確認するには、[検証ステーションを提示] アクティビティをドラッグアンドドロップして、入力の詳細を入力します。

7. 抽出結果をエクスポートする

抽出結果をエクスポートするには、[抽出結果をエクスポート] アクティビティをワークフローの最後にドラッグアンドドロップします。これにより、DataSet に結果が出力されます。この出力には複数の表が含まれており、Excel ファイルに書き込んだり下流工程で直接使用したりできます。

サンプルをダウンロードする

このサンプルプロジェクトはこちらからダウンロードできます。

この例には、次の 2 つのワークフローが含まれます。

Main.xaml - このワークフローでは、検証ステーションを使用して抽出結果が検証されます。これは、前述のセクションで説明したワークフローです。
Main - Unattended.xaml - このワークフローでは、検証アクションを使用して抽出結果が検証されます。このワークフローについては、以降のセクションで説明します。

パブリックエンドポイントと検証アクションを使用して ML モデル「Receipts (領収書)」を使用する

次に、検証ステーションを提示する代わりに Action Center の検証アクションを使用する方法を見てみましょう。

Action Center 内のタスクについて

UiPath Action Center を使用すると、承認、権限の変更、例外対応などの人間が行うべき意思決定がオートメーションに含まれる場合に、プロセスをロボットから人間に簡単かつ効率的に引き渡し、その後再びロボットに返すことができます。

Document Understanding の Action Center アクティビティには、 UiPath.IntelligentOCR.Activities パッケージと UiPath.Persistance.Activities パッケージがあります。UiPath Studio の [プロジェクト設定] > [全般] にある [永続性をサポート] オプションを必ず有効化してください。

検証アクションについて

ドキュメントの検証アクションを Action Center に追加するオーケストレーションプロセスをオンプレミス版 Orchestrator と Automation Cloud の両方で追加すると、生産性を向上できます。この操作により、ドキュメントをローカルに保存したり、人間が操作する各マシンに Robot をインストールしたり、人間のユーザーが検証を完了するのをロボットに待機させたりする必要がなくなります。

詳しくは、こちらをご覧ください。

検証アクションの使用方法

上記のセクションで説明した手順 1 から 5 を繰り返します。

その後、[検証ステーションを提示] アクティビティを使用する代わりに、[ドキュメント検証アクションを作成] アクティビティと [ドキュメント検証アクション完了まで待機し再開] アクティビティを使用します。

以下の画像は、[ドキュメント検証アクションを作成] アクティビティとそのプロパティです。

このアクティビティにより、Action Center 内にドキュメント検証アクションが作成されます。[ドキュメント検証アクションを作成] アクティビティの出力結果は、その後 [ドキュメント検証アクション完了まで待機し再開] アクティビティで使用できます。これにより、オーケストレーションワークフローを中断して、Action Center での人間のアクションが完了した時に再開するようにできます。