
非構造化ドキュメントや複雑なドキュメント ユーザー ガイド
UiPath® IXP は、マルチモーダルなデータの分類と抽出を提供し、企業のデータを迅速、大規模に活用できます。これにより、選択できる一連の機能を使用して、次のようなさまざまなドキュメントの種類を処理できます。
- Communications Data (Communications Mining)
- 構造化されたドキュメントや半構造化されたドキュメント (Document Understanding)
- 非構造化ドキュメントや複雑なドキュメント (生成 AI による抽出)
詳しくは、『IXP 概要ガイド』の「機能の種類」、「適切な機能を選択する」、および「機能にアクセスする」をご覧ください。
複雑な非構造化ドキュメントからデータを抽出する場合、現在どの段階にいるかに応じて、次のような一般的な課題があります。
モデルの構築時とテスト時
- さまざまなドキュメントの種類 (ユース ケース) でテストするには、さまざまな LLM へのアクセスが必要になる
- ユーザー プロンプトを素早く反復して予測結果を表示するのが難しい
- 予測結果を最適化するには、より多くのパラメーターへのアクセスが必要
- 予測を検証してグラウンド トゥルースを提供するのが困難である
- モデルおよびフィールド レベルのメトリックを評価するのに時間がかかる
- モデルのパラメーター (モデル、ユーザー プロンプト、チャンク サイズ、ゼロショット、少数ショットなど) を調整した場合の影響を比較する必要がある
- 適合率、再現率、F1 スコアなどのパフォーマンス メトリックを可視化する必要がある
運用環境のデプロイ時
- ユース ケースのデータ スキーマを簡単に変更および保守する方法がない
- モデルのガバナンスがほとんどない。たとえば、以前のバージョンに戻したり、特定のバージョンを本番環境用に選択したりする機能がない。
このセクションでは、生成 AI による抽出を使用して複雑な非構造化ドキュメントを処理する、非構造化ドキュメントや複雑なドキュメントの機能について説明します。この機能は、前のセクションで概説した課題を解決するのに役立ちます。
この機能は、データの形式が一貫していない高度なドキュメント処理シナリオに最適です。この機能は以下の場合に使用します。
-
ドキュメントに、自由形式のテキストの段落や、以下のような複雑な要素が含まれる場合。
- 複雑な表
- グラフィック
- グラフ
- チェックボックス
- 吹き出しボックス
- 署名
- 手書き文字など
-
推論値を抽出する必要がある場合。推論値とは、直接記載されているわけではなく、コンテキストから導き出す必要がある情報です。
-
ドキュメント間または抽出するフィールド内で、レイアウトや構造に大きなばらつきがある場合。
-
1 つのファイルとして結合された複数のドキュメントの種類のスタックを扱っており、最初にドキュメントを分割することなくデータを抽出する必要がある場合。
非構造化ドキュメントや複雑なドキュメントの機能について詳しくは、『IXP 概要ガイド』の「適切な機能を選択する」をご覧ください。
非構造化ドキュメントや複雑なドキュメントの機能はさまざまな業界の多様なシナリオに適しており、以下をはじめとして、あらゆる業種や部署に対応する機能が多数含まれます。
法務サービス
- 雇用契約
- 運営契約
- 投資契約
医療
- 診療内容明細書
- 緊急外来レポート
- 紹介状
小売り
- 返金リクエスト
- 顧客からの苦情
- 製品カタログ
不動産
- 賃貸契約書
- 住宅ローン
- 不動産鑑定評価書
金融または銀行
- 証券取引明細書
- ローンの申請
- 信用報告書
製造
- 変更指示
- 製品仕様
- 供給オーダー
保険
- 保険証券
- 保険金請求
- 保険適用拒否レター
テクノロジーまたは電気通信
- サービス契約
- ソフトウェア ライセンス
- インシデント レポート
「非構造化ドキュメントや複雑なドキュメント」機能にアクセスするには、IXP の概要ガイド「機能にアクセスする」をご覧ください。