ixp
latest
false

非構造化ドキュメントと複雑なドキュメント ユーザー ガイド
最終更新日時 2025年10月20日
このセクションでは、非構造化ドキュメントと複雑なドキュメントの生成 AI による抽出モデルを構築するエンドツーエンドのプロセスの概要について説明します。
優れたパフォーマンスのモデルの構築は反復的なプロセスであり、継続的なプロンプト エンジニアリングと出力の検証が必要になります。
- ユース ケースの代表的なドキュメントのサンプルをアップロードします。
- どのようなデータ ポイント (フィールド) を抽出し、そのデータ ポイントがどのように相互に関連しているか (フィールド グループ) を特定する
- 抽出に関する全体的な指示を入力する
- 対応する抽出スキーマを作成し、フィールド グループとフィールドに関する指示を入力する
- 抽出データを検証して改良します。
- 初期の予測を確認し、パフォーマンスがどの程度良好かを確認する
- プロンプトの指示を変更し、モデルのパフォーマンスへの影響をテストする
- 抽出データを確認または修正し、パフォーマンスの評価のためのグラウンド トゥルースを収集する