Document Understanding アクティビティ

最終更新日時 2025年3月21日

PREVIEW
ドキュメントを分類 - プレビュー

UiPath.IntelligentOCR.StudioWeb.Activities.ClassifyDocument

説明

このアクティビティを使用すると、目的の分類器と分類するドキュメントを選択してドキュメントを分類できます。

注: [ドキュメントを分類] アクティビティでは、パブリックエンドポイントを使用します。

既知の制限事項

プロジェクトの種類 [Generative Predefined] とそれに対応する抽出器は、Automation Suite では利用できません。

プロジェクトの対応 OS

Windows | クロスプラットフォーム

構成

デザイナーパネル

入力 - 入力ファイルまたは Document Data オブジェクトを指定します。
重要: 1 つのファイルに含めることができる最大ページ数は 500 です。この制限を超えるファイルは分類できません。

ヒント: ファイルが IResource 型の変数として格納されていない場合、変換を実行するオプションがあります。このためには、[入力] プロパティフィールドで LocalResource.FromPath(<reference_to_the_file>) を使用します。
[繰り返し (コレクションの各要素)] アクティビティを使用して、ファイルのリストを繰り返し処理するシナリオを考えてみます。currentItem が、繰り返し処理する変数であるとします。currentItem を IResource に変換するには、LocalResource.FromPath(currentItem) を [入力] フィールドに貼り付けます。
Document Understanding プロジェクト - ドロップダウンメニューからお使いの Document Understanding プロジェクトを選択する必要があります。利用可能なオプションは次のとおりです。
- Predefined - 標準的なシナリオに推奨される、事前トレーニング済みの専門家されたモデルを使用するプロジェクトです。
- Generative Predefined - 事前トレーニング済みの生成 AI モデルを使用するプロジェクトです。ドキュメントデータを分類または抽出するための入力として指示を入力できます。
- 接続先のテナントおよびフォルダーにある既存のプロジェクト。
- + アイコンを選択して新しいプロジェクトを作成できます。
注: テナントに 500 個を超えるプロジェクトを作成し、[ドキュメントを分類] アクティビティを使用した場合、UiPath Studio または Studio Web には、最初の 500 個を超えるプロジェクトは表示されません。したがって、これらのプロジェクトは使用できません。
分類器 - [Predefined] プロジェクトを使用している場合は、ドロップダウンメニューから目的の Document Understanding の分類器を選択できます。
注: 生成 AI 分類器に送信されたデータは、公開されていない LLM モデルインスタンスに送信されます。外部には送信されず、処理後に保存またはトレーニングに使用されることはありません。
- [Predefined] プロジェクトの場合、次の 2 つのオプションがあります。
  - ML Classification (ML 分類) – ML ベースの分類器です。
  - Generative Classifier - 生成 AI 分類器です。
    重要:
    この機能は現在のところ監査プロセスの一部であり、レビューが完了するまで FedRAMP 承認の一部と見なすべきではありません。現在レビュー中の機能の完全なリストについては、こちらをご覧ください。
    - ドキュメントの種類の詳細 - ドキュメントの種類を識別するための指示です。キーと値のペアとして指定します。キーはドキュメントの種類の名前を、値はドキュメントの種類の説明を表します。分類器がドキュメントを識別するのに役立ちます。
      - キー - 分類結果として使用するドキュメントの種類の名前を指定します (最大 30 文字)。
      - 値 - ドキュメントの種類の識別方法について生成 AI 分類器に指示を提供する必要があります。最大 1000 文字を入力できます。
- [Generative Predefined] プロジェクトでは、[生成 AI 分類器] のみを使用できます。
バージョン (プレビュー) - 既存の Document Understanding モダンプロジェクトを使用する場合は、このプロパティを使用します。データを処理するプロジェクトのバージョンに対応するタグを選択します。たとえば、バージョン 3 に割り当てられた [運用] タグを選択すると、運用環境にあるプロジェクトのバージョン 3 のデータが処理されます。
[バージョン] の既定値は [ステージング] です。選択したプロジェクトに [ステージング] タグが存在しない場合、既定値は [運用] になります。

タグを選択すると、そのバージョンでサポートされているドキュメントの種類のリストが表示されます。

プロパティパネル

詳細設定

最小信頼度 - 分類時にドキュメントの種類を割り当てる基準となる、最小の信頼度のしきい値を指定します。ドキュメントの信頼度スコアがこのしきい値を下回ると、ドキュメントの種類が「不明」として報告されます。
ヒント: ほとんどのドキュメントの種類では、予測と信頼度レベルが生成されます。このプロパティを設定すると、しきい値を上回る信頼度レベルを持つ予測のみが考慮されるため、誤検知が防止されます。最適な信頼度レベルを特定するには、ワークフロー内でさまざまなドキュメントをテストし、その結果を Excel スプレッドシートなどに記録した上で、どのしきい値が最も正確かを分析します。

設計時の外部接続

設計時の外部接続を使用すると、他のプロジェクトまたはテナントの Document Understanding のリソースを使用してアクティビティを活用できます。これらのプロパティを設定する前に、「実行時の外部接続を設定する」のページに記載された前提条件を満たしていることを確認してください。これらの手順が完了したら、実行時の外部接続の設定に進むことができます。
- アプリ ID: 作成済みの外部アプリケーションのアプリ ID を入力します。
- アプリシークレット: 作成済みの外部アプリケーションのアプリシークレットを入力します。
- テナント URL: 外部アプリケーションを作成したテナントの URL を入力します。これは、設計時に使用するリソースが存在するテナントです。
  URL の形式は https://<baseURL>/<OrganizationName>/<TenantName> です。

入力

タイムアウト (秒) - 生成 AI モデルへの呼び出しの最大実行時間 (秒単位) です。このタイムアウト値を超えると、遅延やハングを防ぐために操作が自動的に終了されます。このプロパティは、[生成 AI 分類器] が分類器として選択されている場合にのみ表示されます。

出力

ドキュメントデータ - ファイルから抽出される検証済みのすべてのフィールドデータです。

実行時の外部接続

実行時の外部接続を使用すると、オンプレミスのロボットを介してアクティビティを実行できます。これらのプロパティを設定する前に、「実行時の外部接続を設定する」のページに記載された前提条件を満たしていることを確認してください。これらの手順が完了したら、実行時の外部接続の設定に進むことができます。

実行時の資格情報アセット - このフィールドは、ロボットがローカルの Orchestrator に接続されているとき、または別のテナントから接続されているときに、Document Understanding のリソースにアクセスする必要がある場合に使用します。認証のための資格情報アセットは、次のいずれかの方法で入力できます。
- ドロップダウンリストから、UiPath® Robot が接続されている Orchestrator の目的の資格情報アセットを選択します。
- プロジェクトにアクセスするための外部アプリケーションの資格情報を保存する Orchestrator 資格情報アセットへのパスを手動で入力します。
  パスの形式は、<OrchestratorFolderName>/<AssetName> のようになります。
実行時のテナント URL - このフィールドは、[実行時の資格情報アセット] フィールドとともに使用します。分類を実行するためにロボットが接続するテナントの URL を入力します。URL の形式は、https://<baseURL>/<OrganizationName>/<TenantName> です。

生成 AI 分類器を使用する

[ドキュメントを分類] アクティビティの生成機能をすぐに使用するには、以下の手順を実行してください。

[ドキュメントを分類] アクティビティを追加します。
[プロジェクト] ドロップダウンリストから、[Predefined] または [Generative Predefined] を選択します。
[分類器] で [生成 AI 分類器] を選択します。
[ドキュメントの種類の詳細] プロパティがアクティビティの本体に表示されます。

[ドキュメントの種類の詳細] コレクションで、指示をディクショナリのキーと値のペアとして入力します。各要素は次のように指定します。

キーとは [ドキュメントの種類] で入力する値のことです (例: 履歴書)。

値とは、[生成プロンプト] で入力する値のことで、ドキュメントの種類を識別するために生成分類器が使用する説明です。

以下の表に、キーと値のペアのサンプルをいくつか示してありますので、確認してください。

表 1. 生成 AI 分類器のプロンプトとして使用されるキーと値のペア
キー	値 (Value)
履歴書	「教育」、「スキル」、「経験」などの、履歴書に関連する一般的なキーワードを検索してください。
請求書 (Invoice)	「請求番号」、「請求先」、「合計金額」などの、一般的なフィールド名を検索してください。