activities
latest
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
UiPath logo, featuring letters U and I in white

Document Understanding アクティビティ

最終更新日時 2025年9月4日

ドキュメントを分類

UiPath.IntelligentOCR.StudioWeb.Activities.ClassifyDocument

説明

このアクティビティを使用すると、目的の分類器と分類するドキュメントを選択してドキュメントを分類できます。

注: [ドキュメントを分類] アクティビティでは、パブリック エンドポイントを使用します。

生成モデルでサポートされている言語は、使用されている OCR エンジンと同じです。詳しくは、「OCR でサポートされている言語」をご覧ください。

このアクティビティが Studio のワークフローの最初の Document Understanding アクティビティでない限り、入力は Document Data である必要があります。File は、アクティビティが Studio のワークフローの最初の Document Understanding アクティビティである場合にのみ、入力として使用します。

既知の制限事項

プロジェクトの種類 [Generative Predefined] とそれに対応する抽出器は、Automation Suite では利用できません。

プロジェクトの対応 OS

Windows | クロスプラットフォーム

構成

デザイナー パネル
  • 入力 - 入力ファイルまたは Document Data オブジェクトを指定します。
    重要: 1 つのファイルに含めることができる最大ページ数は 500 です。この制限を超えるファイルは分類できません。
    ヒント: ファイルが IResource 型の変数として格納されていない場合、変換を実行するオプションがあります。このためには、[入力] プロパティ フィールドで LocalResource.FromPath(<reference_to_the_file>) を使用します。
    [繰り返し (コレクションの各要素)] アクティビティを使用して、ファイルのリストを繰り返し処理するシナリオを考えてみます。currentItem が、繰り返し処理する変数であるとします。currentItemIResource に変換するには、LocalResource.FromPath(currentItem)[入力] フィールドに貼り付けます。
  • Document Understanding プロジェクト - ドロップダウン メニューからお使いの Document Understanding プロジェクトを選択する必要があります。利用可能なオプションは次のとおりです。
    • Predefined - 標準的なシナリオに推奨される、事前トレーニング済みの専門家されたモデルを使用するプロジェクトです。
    • Generative Predefined - 事前トレーニング済みの生成 AI モデルを使用するプロジェクトです。ドキュメント データを分類または抽出するための入力として指示を入力できます。
    • 接続先のテナントおよびフォルダーにある既存のプロジェクト。
    • + アイコンを選択して新しいプロジェクトを作成できます。
    注: テナントに 500 個を超えるプロジェクトを作成し、[ドキュメントを分類] アクティビティを使用した場合、UiPath Studio または Studio Web には、最初の 500 個を超えるプロジェクトは表示されません。したがって、これらのプロジェクトは使用できません。
  • 分類器 - [Predefined] プロジェクトを使用している場合は、ドロップダウン メニューから目的の Document Understanding の分類器を選択できます。
    注: 生成 AI 分類器に送信されたデータは、公開されていない LLM モデル インスタンスに送信されます。外部には送信されず、処理後に保存またはトレーニングに使用されることはありません。
    • [Predefined] プロジェクトの場合、次の 2 つのオプションがあります。
      • ML Classification (ML 分類) – ML ベースの分類器です。
      • Generative Classifier - 生成 AI 分類器です。
        重要:

        この機能は現在のところ監査プロセスの一部であり、レビューが完了するまで FedRAMP 承認の一部と見なすべきではありません。現在レビュー中の機能の完全なリストについては、こちらをご覧ください。

        • ドキュメントの種類の詳細 - ドキュメントの種類を識別するための指示です。キーと値のペアとして指定します。キーはドキュメントの種類の名前を、値はドキュメントの種類の説明を表します。分類器がドキュメントを識別するのに役立ちます。
          • ドキュメントの種類 - 分類結果として使用するドキュメントの種類の名前を指定します (最大 30 文字)。
          • 指示 - ドキュメントの種類の識別方法について生成 AI 分類器に指示を提供する必要があります。最大 1000 文字を入力できます。
    • [Generative Predefined] プロジェクトでは、[生成 AI 分類器] のみを使用できます。
  • バージョン - 既存の Document Understanding モダン プロジェクトを使用する場合は、このプロパティを使用します。データを処理するプロジェクトのバージョンに対応するタグを選択します。たとえば、バージョン 3 に割り当てられた [運用] タグを選択すると、運用環境にあるプロジェクトのバージョン 3 のデータが処理されます。

    [バージョン] の既定値は [ステージング] です。選択したプロジェクトに [ステージング] タグが存在しない場合、既定値は [運用] になります。

    タグを選択すると、そのバージョンでサポートされているドキュメントの種類のリストが表示されます。

プロパティ パネル

詳細設定

  • 最小信頼度 - 分類時にドキュメントの種類を割り当てる基準となる、最小の信頼度のしきい値を指定します。ドキュメントの信頼度スコアがこのしきい値を下回ると、ドキュメントの種類が「不明」として報告されます。
    ヒント: ほとんどのドキュメントの種類では、予測と信頼度レベルが生成されます。このプロパティを設定すると、しきい値を上回る信頼度レベルを持つ予測のみが考慮されるため、誤検知が防止されます。最適な信頼度レベルを特定するには、ワークフロー内でさまざまなドキュメントをテストし、その結果を Excel スプレッドシートなどに記録した上で、どのしきい値が最も正確かを分析します。
  • 設計時の外部接続

    The design-time external connection allows you to leverage the activity using Document Understanding resources from other projects or tenants. Before configuring these properties, ensure you have fulfilled the prerequisites mentioned in the Configuring runtime external connection page. Once these steps are completed, you can then proceed to configure the runtime external connection.

    • アプリ ID: 作成済みの外部アプリケーションのアプリ ID を入力します。
    • アプリ シークレット: 作成済みの外部アプリケーションのアプリ シークレットを入力します。
    • テナント URL: 外部アプリケーションを作成したテナントの URL を入力します。これは、設計時に使用するリソースが存在するテナントです。
      URL の形式は https://<baseURL>/<OrganizationName>/<TenantName> です。

入力

  • タイムアウト (秒) - 生成 AI モデルへの呼び出しの最大実行時間 (秒単位) です。このタイムアウト値を超えると、遅延やハングを防ぐために操作が自動的に終了されます。このプロパティは、[生成 AI 分類器] が分類器として選択されている場合にのみ表示されます。

出力

  • ドキュメント データ - ファイルから抽出される検証済みのすべてのフィールド データです。

実行時の外部接続

The runtime external connection allows you to execute the activity via on-premises robots. Before configuring these properties, ensure you have fulfilled the prerequisites mentioned in the Configuring runtime external connection page. Once these steps are completed, you can then proceed to configure the runtime external connection.

  • 実行時の資格情報アセット - このフィールドは、ロボットがローカルの Orchestrator に接続されているとき、または別のテナントから接続されているときに、Document Understanding のリソースにアクセスする必要がある場合に使用します。認証のための資格情報アセットは、次のいずれかの方法で入力できます。
    • ドロップダウン リストから、UiPath® Robot が接続されている Orchestrator の目的の資格情報アセットを選択します。
    • プロジェクトにアクセスするための外部アプリケーションの資格情報を保存する Orchestrator 資格情報アセットへのパスを手動で入力します。
      パスの形式は、<OrchestratorFolderName>/<AssetName> のようになります。
  • 実行時のテナント URL - このフィールドは、[実行時の資格情報アセット] フィールドとともに使用します。分類を実行するためにロボットが接続するテナントの URL を入力します。URL の形式は、https://<baseURL>/<OrganizationName>/<TenantName> です。

生成 AI 分類器を使用する

[ドキュメントを分類] アクティビティの生成機能をすぐに使用するには、以下の手順を実行してください。

  1. [ドキュメントを分類] アクティビティを追加します。
  2. [プロジェクト] ドロップダウン リストから、[Predefined] または [Generative Predefined] を選択します。
  3. [分類器][生成 AI 分類器] を選択します。

    [ドキュメントの種類の詳細] プロパティがアクティビティの本体に表示されます。

  4. [ドキュメントの種類の詳細] コレクションで、指示をディクショナリのキーと値のペアとして入力します。各要素は次のように指定します。
    • キーとは [ドキュメントの種類] で入力する値のことです (例: 履歴書)。
    • とは、[生成プロンプト] で入力する値のことで、ドキュメントの種類を識別するために生成分類器が使用する説明です。

      以下の表に、キーと値のペアのサンプルをいくつか示してありますので、確認してください。

      表 1. 生成 AI 分類器のプロンプトとして使用されるキーと値のペア
      キー値 (Value)
      履歴書「教育」、「スキル」、「経験」などの、履歴書に関連する一般的なキーワードを検索してください。
      請求書 (Invoice)「請求番号」、「請求先」、「合計金額」などの、一般的なフィールド名を検索してください。
    図 1. 生成 AI 分類器のプロンプトとして使用されるキーと値のペア 生成 AI 分類器のプロンプトとして使用されるキーと値のペア

このページは役に立ちましたか?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
Uipath Logo
信頼とセキュリティ
© 2005-2025 UiPath. All rights reserved.