- はじめに
- 機能の種類
- 適切な機能を選択する
- アクセス制御と管理
- ライセンス
- よくある質問

IXP 概要ガイド
- コミュニケーション データ (Communications Mining™ 経由)
- 非構造化ドキュメントと複雑なドキュメント (生成 AI による非構造化ドキュメントからの抽出機能を経由)
- 構造化されたドキュメントと半構造化されたドキュメント (Document Understanding™ 経由)
コミュニケーションを処理するには、コミュニケーション データを使用します。
ドキュメントを処理するには、次の機能を使用します。
- IXP の非構造化ドキュメントや複雑なドキュメントの機能。最大 50 ページのドキュメントを処理できます。現在、50 ページから 150 ページのドキュメントのサポートはプレビュー段階です。これは一時的な制限であり、今後のリリースで増加される予定です。
- Studio Web またはデスクトップ版の Studio でのみ利用可能な Document Understanding の生成 AI による抽出アクティビティ。50 ページを超えるドキュメントを処理できます。
- Document Understanding™ のクラシック エクスペリエンスまたはモダン エクスペリエンス
ユース ケースにコミュニケーションとドキュメントの両方のデータの種類が含まれる場合は、該当するすべての機能を使用します。たとえば、メールを [コミュニケーション データ] タブの Communications Mining 機能で処理したり、添付ファイルをドキュメントの種類に基づいて処理したりできます。次のようなアプローチが考えられます。
- オプション 1: コミュニケーション データ、構造化ドキュメント、半構造化ドキュメント
- オプション 2: コミュニケーション データ、非構造化ドキュメント、複雑なドキュメント
- オプション 3: コミュニケーション データ、構造化ドキュメントと半構造化ドキュメント、非構造化ドキュメントと複雑なドキュメント
このトピックについて詳しくは、「適切な機能を選択する」をご覧ください。
メール、メッセージ、チケット、レビューといった短い形式の非構造化コミュニケーションはすべて、Communications Mining™ の [コミュニケーション データ] 機能を使用して処理する必要があります。
コミュニケーション データの抽出は、特化型 AI と生成 AI の組み合わせに基づいているため、ユーザー エクスペリエンスを向上させ、すぐに効果を確認できます。
Communications Mining では、生成 AI によるアノテーションや生成 AI による抽出など、この機能に含まれるすべての生成 AI 機能をデータセット レベルで無効化できます。
[非構造化ドキュメントと複雑なドキュメント] 機能と、Document Understanding の生成 AI による抽出アクティビティは、非構造化ドキュメントや複雑なドキュメントに最適です。
このようなドキュメントには、自由形式のテキストの段落や、以下のような複雑な要素が含まれます。
- 複雑な表
- グラフィック
- グラフ
- チェックボックス
- 吹き出しボックス
- 署名
- 手書き文字など
非構造化ドキュメントは異なる形式やレイアウトで提供されていることが多いため、複数の抽出スキーマが必要になることがあります。また、複数のドキュメントの種類が 1 つのドキュメント スタックに結合されている可能性もあります。たとえば、住宅ローンの申請書類では、身分証明書、住所証明書、銀行預金残高証明書などが結合されます。このような結合されたドキュメントが別個のドキュメントの種類に分割されていない場合、生成 AI による抽出が必要になることがあります。
さらに、ドキュメントに明示的に存在しない値を抽出しなければならない場合もあります。つまり、この場合、値を推論する必要があります。推論値の例として以下が挙げられます。
- ドキュメントのどこにも存在しないが、そのコンテキストから暗示される値
- ドキュメント内の複数の領域にわたり連結する必要がある値
- 複数の段落、行、または列にまたがる値
IXP と Document Understanding の生成 AI による抽出アクティビティは、どちらも生成 AI 機能に依拠しています。そのため、これらの製品を使用するには、必ず生成 AI を有効化する必要があります。組織のポリシーによって運用環境での生成 AI 機能の使用が制限されている場合は、Document Understanding™ のクラシック プロジェクトまたはモダン プロジェクトを使用します。
非構造化ドキュメントや複雑なドキュメントに対応した IXP の機能では現在、最大 50 ページのドキュメントがサポートされています。現在、50 ページから 150 ページのドキュメントのサポートはプレビュー段階です。それまでの間に 50 ページを超える非構造化ドキュメントを処理する必要がある場合は、Document Understanding の生成 AI による抽出アクティビティを、長いドキュメント用の組み込み RAG と一緒に使用できます。
Document Understanding の生成 AI による抽出アクティビティには、Studio Web またはデスクトップ版の Studio からのみアクセスできます。この機能では以下の抽出器を使用できます。
- Long Document Simple Layout - 主にテキストと見出しで構成される長文のドキュメント向けに最適化されています。GPT4-turbo AI Trust Layer LLM を使用します。テキスト処理のみをサポートし、RAG が組み込まれており、ドキュメントあたり 500 ページの制限があります。
- Long Document Complex Layout (プレビュー) - 表、画像、手書き文字、フォーム要素、フローティング吹き出しボックスなどの複雑な要素を含む長文のドキュメント用に最適化されています。GPT-4o AI Trust Layer LLM を使用します。テキスト処理と画像処理の両方をサポートし、RAG が組み込まれており、ドキュメントあたり 500 ページの制限があります。
- Short Document Complex Layout (プレビュー) - 表、画像、手書き文字、フォーム要素、フローティング吹き出しボックスなどの複雑な要素を含む、構造化または半構造化された短いドキュメント向けに最適化されています。GPT-4o AI Trust Layer LLM を使用します。テキスト処理と画像処理の両方をサポートし、RAG は組み込まれておらず、ドキュメントあたり 20 ページの制限があります。
他のメリットとして、[非構造化ドキュメントと複雑なドキュメント] 機能は以下も提供します。
- ドキュメントのアノテーションと検証用のユーザー インターフェイス。
- すべての抽出のパフォーマンス統計情報と信頼度スコア。
- 抽出スキーマとプロンプトの指示を素早く反復処理可能。
- 異なるモデル バージョンを保存および比較可能。
-
異なる LLM を選択可能。現在、IXP でサポートされているのは GPT-4o のみです。ただし、今後のリリースではさらに多くのモデルが利用可能になる予定です。
- モデルの設定を構成可能 (温度、シードなど)。
UiPath® IXP の [構造化されたドキュメントと半構造化されたドキュメント] 機能では、Document Understanding™ のクラシック プロジェクトとモダン プロジェクトを利用します。これらのプロジェクトは、構造化されたドキュメントまたは半構造化されたドキュメントに最適であり、複雑な要素を含まない、同じまたは非常によく似たレイアウトに従う傾向があります。
Document Understanding のクラシック エクスペリエンスとモダン エクスペリエンスでは、すぐに使える専門化されたモデル と生成 AI 機能を組み合わせて使用します。自動分類や生成 AI によるアノテーションなど、この機能に含まれるすべての生成 AI 機能は AI Trust Layer から管理できます。
クラシック プロジェクトを選択すべき場合と、モダン プロジェクトを選択すべき場合について詳しくは、「プロジェクトの種類を選択する」をご覧ください。