IXP - モデルの設定

ixp

latest

false

非構造化ドキュメントと複雑なドキュメントユーザーガイド

重要 :

このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。新しいコンテンツの翻訳は、およそ 1 ～ 2 週間で公開されます。

モデルの設定

IXP プロジェクトの LLM の設定 (インテリジェントな前処理オプションや [構築] タブからの抽出モデルの選択など)。

概要

基盤となる LLM とその設定は、[構築] タブの [モデルの設定] オプションで構成できます。

利用可能な設定は次のとおりです。

インテリジェントな前処理:
- なし
- 表モデル - mini
- 表モデル
- Layout モデル (Extended Languages) - プレビュー版
抽出モデル:
- GPT-4o
- Gemini
詳細オプション:
- 属性付け
- 温度
- 上位 P
- シード
- 頻度ペナルティ
- プロンプトの上書き

これらの設定を調整して、モデルの予測の精度を向上させ、パフォーマンスを強化します。

インテリジェントな前処理

インテリジェントな前処理オプションにより、複雑な書式設定のためにモデルがドキュメントを解釈することが難しい場合でも、予測パフォーマンスが向上します。

これには、以下のオプションが含まれます。

なし - これは既定のオプションです。表形式コンテンツを含まないほとんどのドキュメントに適しています。
表モデル - mini - 表形式のコンテンツと待機時間に対して最適化されています。このオプションは、単純な表または複数の表を含むドキュメントに最適です。
表モデル - より複雑な表形式のコンテンツ用に最適化されています。このオプションは、複雑な入れ子になった表を含むドキュメント、セルが結合された表、箇条書き、または複数のページにまたがる表に最適です。
注:
- この場合、複雑な表で最高のパフォーマンスが得られますが、予測の待機時間が長くなります。
- この機能は、AI Trust Layer を介して Gemini モデルに依存します。
Layout モデル (Extended Languages) - 抽出前に準備ステップを追加し、視覚的な構造に起因して解釈が困難なドキュメントをモデルが読みやすくします。このオプションは、チェックボックス、手書き箇所、高密度な表があるフォームや、表、リスト、フリーテキストなどのさまざまな種類のコンテンツが混在するドキュメントに最適です。この機能について詳しくは「拡張言語の Layout モデル」をご覧ください。

インテリジェントな前処理の例

次の図に、 テーブルモデル モードを使用せずに LLM に対して抽出クエリを実行する例が示されています。この場合、列 this period の値が year to date 列の値と混同されます。

次の画像に、 テーブルモデル モードを使用した抽出の例が示されており、 this period と year to dateの両方の列の値が正しく抽出されています。

抽出モデル

[抽出モデル] オプションは、抽出に使用される基盤となる LLM を表します。

利用可能なモデルは次のとおりです。

GPT-4o
Gemini

最適なモデルを選ぶ

モデルによって、ユースケースごとのパフォーマンスは異なりますが、可能な場合は Gemini の使用をお勧めします。パフォーマンスとユーザーエクスペリエンスの最適化に役立つ他のいくつかの前処理および後処理機能も Gemini ベースです。

GPT-4o には 50 ページという制限があります。

Gemini 2.5 Flash は、1 回の呼び出しで最大 500 ページのドキュメントを IXP で処理でき、プレビュー版ではそれ以上のページ数がサポートされています。Gemini の制限は、ドキュメントの密度によってわずかに異なる場合があります。

フィールド値の観点からは、Gemini 2.5 Flash の出力コンテキストのウィンドウが広いことから、GPT4o よりも多くのフィールド値を処理できます。前処理オプションを指定しない場合は、ドキュメントあたり約 1000 個のフィールド値が厳密な制限になります。この制限は、ドキュメントの複雑さによって異なることがあります。

言語サポート

選択した抽出モデルで十分にサポートされている任意の言語でドキュメントをアップロードし、モデルを構築できます。サポートされる言語のセットは、プロジェクトに選択したモデルによって異なります。

抽出精度はドキュメントの言語によって異なる場合があります。次のような言語では、結果の一貫性が低下する可能性があります。

アラビア語
中国語
ヘブライ語
韓国語

これらの言語の場合は、運用環境に移行する前に、ドキュメントの代表的なサンプルでモデルのパフォーマンスを検証する必要があります。

あるモデルから別のモデルに切り替える

あるモデルから別のモデルに切り替えるには、[抽出モデル] オプションのドロップダウンリストを使用して [保存] を選択します。これにより、新しいプロジェクトバージョンが作成され、新しい予測が自動的に生成されます。

重要:

成熟したプロジェクトでは、タクソノミー (特に指示) と確認済みの予測 (特に推論フィールド) は、通常、一方のモデルの種類に対して最適化されます。切り替え後は、パフォーマンススコアが低下する可能性があります。これは、他のモデルのパフォーマンスに影響を与えている可能性のあるモデル固有の最適化を元に戻すために、指示の反復処理や予測の再確認が必要になる可能性があるためです。

パフォーマンス上の理由からモデルを切り替える必要がある場合は、まず、現在のモデルでは解決できない主要な問題を代替モデルで解決できるかどうかを確認します。解決できる場合は、新しいモデルを最適化して、[評価] でパフォーマンスメトリックを改善します。

ドキュメント処理の制限

実際には、IXP はドキュメントあたり最大 1,200 件のフィールド値を安定して抽出できます。

つまり、ドキュメントで 1,200 件を超えるフィールド値を抽出する必要がある場合、モデルがトークンの上限に達する可能性があります。これは、ドキュメントがこのセクションに記載されているページ制限内に十分に収まっている場合でも発生する可能性があります。UiPath では、今後のリリースでより大きいフィールド値の上限をサポートできるよう研究開発を進めています。

トークンの上限を超えた場合、ページ数に関係なく、予測が不完全または空になる可能性があります。たとえば、80 ページのドキュメントで 1,400 件のフィールド値が抽出された場合、トークンの上限に関する警告がユーザーインターフェイスに表示されることがあります。実行時にトークンの上限を超えた場合は、API 応答は発生の信頼度と抽出結果の信頼度の値として 0 を返して、上限を超えたことを示します。

ページの上限を超えた場合、以下のように、指定された上限に収まるページのみが処理されます。これらの動作は両方が Gemini と GPT-4o の両方に適用されます。

以下のような実行時の制限事項があります。

ドキュメントあたりのページ数:
- Gemini の場合、最大 500 ページ。
- GPT-4o の場合、50 ページ。
トークンの制限 - 長い表など、抽出回数が 200 を超えるデータ量の多いドキュメントは、トークンの制限に達する可能性があります。Gemini では、既定で出力トークンの制限が高くなっているため、1 回の呼び出しで返されるフィールド値の数が増えます。

詳細オプション

詳細オプションでは、モデルの設定をカスタマイズしたり、使用する属性付け方法を選択したり、プロンプトの上書きを使用したりできます。

注:

プロンプトの上書きの使用は、例外的な場合にのみ推奨されます。

設定を展開すると、利用可能なすべてのオプションが表示されます。

属性付け - 予測をドキュメント内の関連する部分またはテキストに属性付けするために使用する方法です。以下のいずれかのオプションを選択します。
- ルールベース - 広範なルールとヒューリスティックのセットを使用して、ページ上の正しい範囲をモデルからの予測値に一致させます。これは低レイテンシのオプションですが、モデルベースのオプションと比較して、属性付けの成功という点ではパフォーマンスを犠牲にします。
- モデルベース - 追加の LLM 呼び出しを使用して、予測値をページ上の正しい範囲に正常に一致させます。多くの場合、これらの値はページのさまざまな部分で繰り返される可能性があるためです。これは、属性付けの成功という点では最もパフォーマンスの高いオプションですが、予測に多少のレイテンシが加わります。このオプションは、Gemini モデルの使用に依存します。
温度 - 使用するサンプリング温度です。0.0 から 2.0 の間の数値を選択します。値が大きいほど、出力はランダムになります。
上位 P - top_p 確率質量のトークンからのみサンプリングします。0.0 から 1.0 までの数値を選択します。
シード - 指定すると、同じシードとパラメーターで要求を繰り返し実行した場合に、同じ結果が返されます。
頻度ペナルティ - -2.0 から 2.0 の数値を選択します。正の値を指定すると、すでにテキスト内に出現したトークンがモデルによって繰り返される確率が低くなります。
プロンプトの上書き - 既定のシステムプロンプトを新しい値で上書きします。このオプションは既定では無効化されています。有効化すると、[タスクの指示のプロンプトを追加] オプションと [フィールドの指示のプロンプトを追加] オプションが有効化されて設定できるようになります。
注:
UiPath® チームは、温度、 トップ P、頻度などのモデル設定の既定値を調査し、最適化しました。そのため、必要な特定の設定が分かっていない限り、これらの値を調整する必要はありません。

概要
インテリジェントな前処理
インテリジェントな前処理の例
抽出モデル
最適なモデルを選ぶ
言語サポート
あるモデルから別のモデルに切り替える
ドキュメント処理の制限
詳細オプション

このページは役に立ちましたか?

前へ抽出予測を検証する

次へ拡張言語の Layout モデル

概要​

インテリジェントな前処理​

インテリジェントな前処理の例​

抽出モデル​

最適なモデルを選ぶ​

言語サポート​

あるモデルから別のモデルに切り替える​

ドキュメント処理の制限​

詳細オプション​