
非構造化ドキュメントと複雑なドキュメント ユーザー ガイド
モデル バージョンをパブリッシュしたら、Studio で IXP の非構造化ドキュメントと複雑なドキュメントのワークフローを構築し、検証ステーション、Action Center、Apps で使用できます。
- パッケージのインストール
- タクソノミーの定義
- ドキュメントのデジタル化
- ドキュメント分類
- ドキュメントの抽出
- ドキュメント検証
Studio ワークフローの構築を開始する際は、実行するプロジェクトの種類を [Windows] または [クロスプラットフォーム] から選択する必要があります。プロジェクトの種類ごとに異なるパッケージが必要です。
プロジェクトの種類に基づいて、以下のパッケージ バージョン以降をインストールしてください。
Windows
- UiPath.DocumentUnderstanding.ML.Activities 1.31.1
- UiPath.Excel.Activities 2.24.3
- UiPath.IntelligentOCR.Activities 6.22.0
- UiPath.System.Activities 24.10.6
- UiPath.Testing.Activities 24.10.3
- UiPath.UIAutomation.Activities 24.10.7
- UiPath.DocumentUnderstanding.Activities 2.12.0
- UiPath.System.Activities 24.10.6
- UiPath.UIAutomation.Activities 24.10.7
選択するプロジェクトの種類にかかわらず、パッケージは手動でインストールすることも、自動でインストールすることもできます。パッケージを自動的にインストールするには、Document Understanding Process テンプレートを使用します。Studio でテンプレートを検索およびインストールする方法について詳しくは、「プロジェクト テンプレート」をご覧ください。
Windows プロジェクト用の IXP ワークフローを構築するには、以下の手順を実行します。
- デスクトップ版の Studio で、基本のプロセスを作成します。
- プロセスを設定する際に、[対応 OS] フィールドで、構築するワークフローの種類を [Windows] または [クロスプラットフォーム] から選択します。詳しくは、「オートメーション プロジェクトについて」をご覧ください。
- [デザイン] タブの [タクソノミー マネージャー] オプションで表フィールドを設定します。
注:
タクソノミー マネージャー
- サポートされているのは、フィールドではなく表の作成です。複数のドキュメントを使用する場合は、タクソノミー マネージャーで IXP のフィールド グループにマッピングされる表フィールドを使用します。
- Intelligent OCR パッケージがインストールされている場合にのみ利用できます。つまり Windows プロジェクトでのみ利用することができ、クロスプラットフォームでは利用できません。
- [シーケンス] に [代入] アクティビティを追加して、ドキュメントの読み込み元を指定します。
- [タクソノミーを読み込み] アクティビティを追加して、以前に設定したフィールドを表示します。
- 各ドキュメントを確認するために、[繰り返し (コレクションの各要素)] アクティビティを追加します。
- 以下のアクティビティを [繰り返し (コレクションの各要素)] 内にドラッグ アンド ドロップします。
- ドキュメントをデジタル化 - 指定したドキュメントを読み取って、ドキュメント オブジェクト モデルの出力を取得します。
- ドキュメント分類スコープ - 複数のモデルとドキュメントの種類を使用する場合に分類モデルを設定します。
- 生成 AI 分類器 - 生成 AI モデルを使用してドキュメントを分類します。
注: ドキュメントの種類 ID がすでにある場合、分類の手順は任意です。 - 各分類結果を確認するために、[繰り返し (コレクションの各要素)] アクティビティをもう 1 つ追加します。
- 以下のアクティビティを [繰り返し (コレクションの各要素)] 内にドラッグ アンド ドロップします。
- [データ抽出スコープ] - 抽出器アクティビティを設定します。
- 生成 AI 抽出器 - 生成 AI モデルを使用してドキュメントを抽出します。
- 必要に応じて、カスタムのビジネス ルールまたはカスタムの後処理ロジックを設定できます。たとえば、[タクソノミーを読み込み] で抽出結果の信頼度のしきい値を設定して、ドキュメントを人間による検証に送る必要があるかどうかを決定できます。検証ルールの設定方法について詳しくは、「構造を確立する」の「検証の設定」セクションをご覧ください。
- 次のいずれかのアクティビティを追加します。
- 検証ステーションを提示 - 検証ステーションで検証する場合に追加します。
- 検証タスクを作成 - Action Center で検証する場合に追加します。
- ドキュメント検証成果物を作成 - Apps で検証する場合に追加します。
この検証手順では、ここに示すアクティビティ以外を使用することもできます。詳しくは、以下のリソースをご覧ください。
検証ステーション
Action Center
Apps (アプリ)
クロスプラットフォーム プロジェクト用の IXP の非構造化ドキュメントと複雑なドキュメントのワークフローを構築するには、以下の手順を実行します。
IXP の非構造化ドキュメントと複雑なドキュメントのモデルを利用するワークフローを使用する場合、検証ステーションは、抽出データをレビュー、確認、改良するための重要なインターフェイスとして機能します。検証ステーション には、モデルがドキュメントをどのように解釈したかが表示されるため、抽出の精度を理解して、不確実な領域を特定し、必要に応じて修正を行うことができます。
検証ステーションでは、各ドキュメントの種類とそれに対応するフィールドが、抽出された値および信頼度インジケーターとともに表示されます。OCR エンジンと抽出モデルの両方から導き出されるこれらの信頼度レベルにより、抽出データの信頼性を検証できます。
検証プロセスについて詳しくは、以下のリソースをご覧ください。
以下の表に、Windows プロジェクトとクロスプラットフォーム プロジェクトの IXP ワークフローの比較を示します。
| Windows | クロスプラットフォーム | |
|---|---|---|
| 必要なパッケージ |
|
|
| タクソノミーを定義する | [タクソノミー マネージャー] オプションを使用して、表のフィールドを手動で編集できます。
注: タクソノミー マネージャーは、Intelligent OCR パッケージがインストールされている場合にのみ利用できます。
| Document Understanding パッケージでは、[ドキュメント データを抽出] アクティビティに IXP モデルのタクソノミー フィールドが自動的に表示されます。 |
| Studio の種類 | デスクトップ版の Studio での使用をお勧めします。 | Studio Web での使用をお勧めします。 |