activities
latest
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 Integration Service で提供されるコネクタ パッケージは機械翻訳で処理されています。
Integration Service のアクティビティ
Last updated 2024年10月7日

ベスト プラクティス

This section includes information on how to use Context grounding effectively.

基本情報

コンテキスト グラウンディングの使用を開始するには、まず次の手順を実行します。

  1. v2024.4 以降の Studio Web またはデスクトップ版の Studio を使用していることを確認します。
  2. Automation Cloud の Integration Service で、 UiPath GenAI アクティビティ コネクタへの接続を確立します。

コンテキストグラウンディングがGenAIアクティビティでデータとどのように相互作用するか

コンテキストグラウンディングを使用するには、データセット(ドキュメントのグループなど)をすぐに利用できる必要があります。 次に、コンテキスト グラウンディングは、次の 3 つのフェーズでデータを操作できます。

  1. コンテキストグラウンディングのデータソースを確立します。
    • オートメーションを使用するか、Orchestrator の共有フォルダー内にある Orchestrator バケットにファイルを直接アップロードします。 コンテキスト グラウンディングはテナントスコープであるため、Orchestrator フォルダーは共有されている必要があります。
    • バケットからドキュメントをアップロードまたは削除できるようにするには、そのフォルダに対する編集権限が必要です。 追加のアクセス許可は必要ありません。
  2. データソースからコンテキストグラウンディングにデータを取り込みます。
  3. データを使用したクエリとグラウンドプロンプト。
    • コンテンツ生成を使用して、ドキュメントを照会し、情報を使用してプロンプトを補強または準備します。

インジェスト パイプラインの管理

インデックス作成とデータ取り込み

[インデックスを作成し取り込み (パブリック プレビュー)] アクティビティは、Orchestrator バケットにアップロードおよび保存されたドキュメントを取り込むための非同期メカニズムを提供します。

[ インデックスを作成し取り込み (パブリック プレビュー)] アクティビティの [その他のプロパティ] にある [ データ型 ] ドロップダウン フィールドで、取り込むファイルの種類を指定できます。

  • PDF - PDF ファイルを取り込みます (既定の選択)。
  • CSV - CSV ファイルを取り込むために使用します。
  • JSON - JSON ファイルを取り込むために使用します。

Orchestrator バケットにさらにファイルを追加した場合は、このアクティビティを再実行して、インデックスを最新の状態に維持する必要があります。

[ファイル グロブ パターン] フィールドは、データ型で設定したファイルの種類に合わせて設計されています。

  • Orchestrator バケットに 1 つのデータ型 (例: すべての PDF) を使用する場合、[ データ型 ] ドロップダウン リストから [PDF] を選択し、[ ファイル グロブ パターン ] の既定値を [ *.] のままにします。
  • Orchestrator バケットに複数のファイルの種類がある場合は、[ データ型 ] ドロップダウンと [ ファイル グロブ パターン ] の両方で取り込むデータ型を指定する必要があります。 パターンはデータ型と同じですが、インジェスト要求を明確にするために違いを指定します。
    • *.pdf をクリックすると表示されます。
    • *.csv CSV ファイルを使用します。
    • JSON の*.jsonです。
たとえば、Orchestrator バケットに PDF をアップロードする場合は、インデックスを、[ データ型 ] を [ ]、[ファイルPDF グロブ パターン] を [ ] に設定して、[ インデックス] と [取り込み (パブリック プレビュー)]*. を実行する必要があります。次に、同じ Orchestrator バケットに CSV ファイルをアップロードします。 [インデックスと取り込み (パブリック プレビュー)] を再度実行し、同じインデックスを選択しますが、[データ型] フィールドを [CSV] に、[ファイル グロブ パターン] を [ *.CSV] に設定する必要があります。

データ ソースからドキュメントを削除する場合も同様のパターンに従います。 インデックスと取り込み (パブリック プレビュー) を使用して再取り込みする場合は、 データ型File Glob を指定して、取り込みでそのドキュメントの種類がインデックスから削除されることが認識されるようにする必要があります。

手記: CSV ファイルの取り込みと再取り込みには、他の種類のデータよりも若干時間がかかる場合があります。

インデックスを作成すると、アクティビティやその他の UiPath 製品がそのインデックスを使用して、ユース ケースにとって重要なドキュメントをクエリできます。

取り込み時間

インジェストは非同期プロセスです。 アクティビティの実行後、データがすぐにクエリ可能になるわけではありません。 インジェスト ペイロードが小さいほど、処理速度が速くなります。 したがって、ドキュメントをバッチでアップロードし、このアクティビティを定期的に実行することをお勧めします。 このプロセスの期間は、データの量と、インジェスト要求を送信する他のユーザーの数によって異なります。

インジェスト要求を送信した後、各ドキュメントが 1 MB 以下であると仮定して、通常は待機することをお勧めします。

  • <10分:10ドキュメント以下の場合。
  • <30分:50ドキュメント以下の場合。
  • 最大 2 時間: 50 以上のドキュメントの場合。
手記: これらは SLA または SLO ではありません。 パフォーマンスは、ドキュメントの性質、サイズ、および同時要求の量によって異なります。

データ ソースに対してデータを追加または削除するたびに、[ インデックスを作成し取り込み (パブリック プレビュー)] アクティビティを実行します。 これにより、データ ソースと、検索と RAG に使用される埋め込みとのパリティが保証されます。

取り込みが完了する前に、インデックス名が [コンテンツ生成] アクティビティに表示されないことがあります。 [コンテンツ生成] アクティビティでインデックス名が見つからない場合、以下の手順を実行します。

[ インデックスを作成し取り込み (パブリック プレビュー)] アクティビティの実行後、既存のインデックスを使用している場合は、[ インデックス ] フィールドの横にある [ 強制更新 ] ボタン メニューを選択します。

docs image

一般的なエラーと解決パターン

  • 取り込みジョブが完了していない場合、エラー ("結果が見つかりません") が表示されることがあります。
  • 取り込みジョブが失敗した場合、エラー ("スキーマが見つかりません") が表示されることがあります。 この場合は、数分待ってからクエリを再試行し、取り込みを再試行してください。
  • エラー ("データソースの同期は既に進行中です") が表示される場合があります。これは、現在進行中のインデックスへのインジェスト ジョブがあることを意味します。 数分待ってから、取り込みを再試行してください。
  • 手動 (強く推奨)。
  • イベント ベース: ストレージ バケットに対して新しいドキュメントが追加または削除されるたびに取り込みパイプラインを実行するオートメーションを設定します。 これは、バケットのドキュメントを定期的に追加または削除する場合に行います。
  • 時間ベース: 取り込みパイプラインをスケジュールに基づいて実行するオートメーションを設定します。 これは、大量のドキュメントの流入/流出が定期的に予想される場合に実行します。 トリガーの作成でこれらのアクティビティを機能させるには、以前の取り込みステートメントが非同期プロセスであると考える必要があります。

インデックスを削除

インデックスと埋め込みを削除し、他の UiPath GenAI アクティビティ エクスペリエンスからクエリ可能なデータ ソースとして削除する場合は、[ インデックスを削除 (パブリック プレビュー)] アクティビティを使用します。 この操作では、データソース内のドキュメントやデータは削除されません (例: Orchestrator バケット)。

先端: [インデックス] アクティビティ、[取り込み (パブリック プレビュー)] アクティビティと [インデックスを削除 (パブリック プレビュー)] アクティビティでは、それぞれ別の Studio プロジェクトを使用して、[ コンテンツ生成 (クエリ/RAG)] アクティビティとは別に実行することをお勧めします。 これにより、非同期の取り込み/削除プロセスを実行できます。

コンテキストグラウンディングを使用したクエリとRAG

[コンテンツ生成] アクティビティには、ドキュメントを操作するための 2 つのオプション (ファイル リソース] と [既存のインデックス]) があります。

ファイル リソース

[ファイル リソース] オプションでは、前のアクティビティのファイル変数(Google ドライブからダウンロードしたドキュメントなど)を使用し、コンテキスト グラウンディングで Just-In-Time (JIT) スタイルの RAG を実行できます。つまり、ドキュメントをインデックスに取り込み、インデックス全体を検索し、プロンプトを拡張してからインデックスを削除するため、これらのデータは永続的ではありません。

注:
  • [ファイル リソース] オプションは現在、PDF 形式のみをサポートしています。
  • これらのドキュメントは小さくしてください (50 ページ未満)。 Integration Service のアクティビティには、上記のすべての処理が実行されるタイムアウト ウィンドウがあります。

  • スキャンした画像を含む PDF がある場合は、ファイルをダウンロードした後に [データを抽出] アクティビティの [Document Understanding OCR] オプションを使用して、これらの画像からテキストを抽出することをお勧めします (コンテキスト グラウンディングではまだ画像がサポートされないためです)。 その extracted_data 出力を、ダウンロードしたファイルを指すその ファイルリソース でプロンプトに渡します。

既存のインデックス

[既存のインデックス] オプションを使用すると、[インデックスを作成し取り込み (パブリック プレビュー)] アクティビティで作成したインデックスを使用できます。データソースからドキュメントを取り込んだ永続的なインデックスに対してクエリを実行します。 このインデックスは、削除するまで何度でも再利用できます。

ワークフロー シーケンス内の [コンテンツの生成] の後に [メッセージをログ ] アクティビティを使用して [上位生成テキスト ] 変数を入力し、ワークフローの実行後に LLM 生成の応答を確認することをお勧めします。

[コンテンツ生成] アクティビティには、[引用文字列 (パブリック プレビュー)] という出力変数もあります。このアクティビティを [メッセージをログ ] アクティビティの入力として使用し、生成出力に影響を与えるために使用されるセマンティック検索結果を表示します。 これは、PDF および JSON データ型の場合にのみ機能します。

このページは役に立ちましたか?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
Uipath Logo White
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.