アクティビティ
最新
バナーの背景画像
Document Understanding アクティビティ
最終更新日 2024 年 4 月 10 日

ドキュメント データを抽出

UiPath.IntelligentOCR.StudioWeb.Activities.ExtractDocumentDataWithDocumentData<UiPath.IntelligentOCR.StudioWeb.Activities.DataExtraction.ExtendedExtractionResultForDocumentData>

入力ファイルまたは Document Data オブジェクトからデータを抽出し、結果を Document Data オブジェクト (入力として受け取ったオブジェクト、または入力ファイル用に新たに作成されたオブジェクト) に格納します。

注:

[ドキュメント データを抽出] アクティビティの前に Document Data オブジェクトを出力するアクティビティが必要です。Document Data オブジェクトは、[ドキュメントを分類] アクティビティなどの「Document Understanding」系アクティビティで出力として生成されます。

[ドキュメント データを抽出] アクティビティは、入力として次のいずれかを受け取ります。
  • ドキュメント データ - [ドキュメントを分類] アクティビティから
  • ファイル - [ファイル/フォルダーを取得] アクティビティまたは [最新のメールを取得] アクティビティから

生成モデルでサポートされている言語は、使用されている OCR エンジンと同じです。詳しくは、「OCR でサポートされている言語」をご覧ください。

プロジェクトの対応 OS: クロスプラットフォーム

プロパティ

  • プロジェクト - ドロップダウン メニューからお使いの Document Understanding プロジェクトを選択する必要があります。利用可能なオプションは次のとおりです。
    • Predefined - 既定のプロジェクトです。
    • カスタム プロジェクトは、Document Understanding に移動して作成できます。
  • 抽出器 - 選択したプロジェクトの抽出器を選択する必要があります。[Predefined] プロジェクトで利用可能なオプションは次のとおりです。
    • こちらに記載されている ML パッケージのいずれか
      注: [ドキュメント データを抽出] アクティビティは、選択した抽出器でドキュメントの種類を上書きします。これは、生成モデルには適用されません。
    • 生成
  • プロンプト - [生成] オプションを選択した場合に表示されます。抽出対象のフィールドを識別するためのプロンプトです。キーと値のペアとして指定します。キーはフィールドの名前を、値はフィールドの説明を表します。抽出器が対象値を識別するのに役立ちます。このフィールドをクリックすると、次のオプションがペアになったプロンプトが表示されます。
    • フィールド名 - 抽出するフィールド名 (例: 期限) を入力する必要があります (最大 30 文字)。
    • 生成 AI プロンプト - 生成 AI 抽出器の入力としてプロンプトを入力する必要があります。 (最大 500 文字)
    ヒント: 生成プロンプトの使用方法に関する効果的な実践については、「生成 AI 抽出器 - 効果的な実践」ページをご覧ください。
  • 入力ファイル - ファイル自体、またはワークフローで他の「Document Understanding」系アクティビティ ([ドキュメントを分類] など) を使用している場合はそのドキュメント データを指定する必要があります。

入力

  • タイムアウト (秒) (プレビュー) - 生成 AI モデルへの呼び出しの最大実行時間 (秒単位) です。このタイムアウト値を超えると、遅延やハングを防ぐために操作が自動的に終了されます。このプロパティは、[生成 AI 抽出器] が抽出器として選択されている場合にのみ表示されます。
出力
  • ドキュメント データ - ファイルから抽出されるすべてのフィールド データです。情報は、[ドキュメントを分類] アクティビティから受け取ることもできます。
    複数値フィールドの場合、すべての値が Document Data で返されます。これらの値は DocumentData.Data.FieldName.MultiValues[] で使用できます。[複数値] の値が null の場合は、そのフィールドが複数値フィールドではないことを意味します。[複数値] プロパティが配列の場合は (空の [] であったとしても)、そのフィールドが複数値フィールドであることを意味します。
注: 生成 AI 抽出器に送信されたデータは、公開されていない LLM モデル インスタンスに送信されます。外部には送信されず、処理後に保存またはトレーニングに使用されることはありません。
注: [ドキュメント データを抽出] アクティビティでは、パブリック エンドポイントを使用します。

Was this page helpful?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
UiPath ロゴ (白)
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.