
非構造化ドキュメントと複雑なドキュメント ユーザー ガイド
モデル バージョンをパブリッシュしたら、Studio で IXP の非構造化ドキュメントや複雑なドキュメント ワークフローを構築し、検証ステーション、Action Center、Apps で使用できます。
- パッケージのインストール
- タクソノミーの定義
- ドキュメントのデジタル化
- ドキュメント分類
- ドキュメントの抽出
- ドキュメント検証
Studio ワークフローの構築を開始する際は、実行するプロジェクトの種類を [Windows] または [クロスプラットフォーム] から選択する必要があります。プロジェクトの種類ごとに異なるパッケージが必要です。
プロジェクトの種類に基づいて、以下のパッケージ バージョン以降をインストールしてください。
Windows
- UiPath.DocumentUnderstanding.ML.Activities 1.31.1
- UiPath.Excel.Activities 2.24.3
- UiPath.IntelligentOCR.Activities 6.22.0
- UiPath.System.Activities 24.10.6
- UiPath.Testing.Activities 24.10.3
- UiPath.UIAutomation.Activities 24.10.7
- UiPath.DocumentUnderstanding.Activities 2.12.0
- UiPath.System.Activities 24.10.6
- UiPath.UIAutomation.Activities 24.10.7
選択するプロジェクトの種類にかかわらず、 パッケージは手動 または自動でインストールできます。パッケージを自動的にインストールするには、 Document Understanding Process テンプレートを使用します。Studio でテンプレートを検索およびインストールする方法について詳しくは、「 プロジェクト テンプレート」をご覧ください。
Windows プロジェクト用の IXP ワークフローを構築するには、以下の手順に従います。
- デスクトップ版の Studio で、 基本プロセスを作成します。
- プロセスを設定するときは、[ 対応 OS ] フィールドで、構築するワークフローの種類 ([Windows] または [クロスプラットフォーム]) を選択します。詳しくは、「 オートメーション プロジェクトについて」をご覧ください。
- [ デザイン] タブの[タクソノミー マネージャー] オプションで表フィールドを設定します。
注:
タクソノミー マネージャー
- フィールドではなくテーブルの作成がサポートされています。複数のドキュメントを使用する場合は、 タクソノミー マネージャーで IXP フィールド グループにマッピングする表フィールドを使用します。
- は、 Intelligent OCR パッケージがインストールされている場合にのみ利用できます。つまり、クロスプラットフォームではなく Windows プロジェクトでのみ利用できます。
- [シーケンス] に [代入] アクティビティを追加して、ドキュメントの読み込み元を指定します。
- [ タクソノミーを読み込み ] アクティビティを追加して、以前に設定したフィールドを表示します。
- 各ドキュメントを確認する [ 繰り返し (コレクションの各 要素)] アクティビティを追加します。
- 以下のアクティビティを [繰り返し (コレクションの各要素)] 内にドラッグ アンド ドロップします。
- ドキュメントをデジタル化 - 指定したドキュメントを読み取り、 ドキュメント オブジェクト モデルの 出力を取得します。
- ドキュメント分類スコープ : 複数のモデルとドキュメントの種類を使用する場合に分類モデルを設定します。
- 生成 AI 分類器 - 生成モデルを使用してドキュメントを分類します。
注: 分類手順は、ドキュメントの種類 ID がすでにある場合には任意です。 - 各分類結果を確認するために、もう 1 つ [繰り返し (コレクションの各 要素)] アクティビティを追加します。
- 以下のアクティビティを [繰り返し (コレクションの各要素)] 内にドラッグ アンド ドロップします。
- [データ抽出スコープ] - 抽出器のアクティビティを設定します。
- 生成 AI 抽出器 - 生成 AI モデルを使用してドキュメントを抽出します。
- 必要に応じて、カスタムのビジネス ルールまたはカスタムの後処理ロジックを設定できます。たとえば、[ タクソノミーを読み込み] で抽出結果の信頼度のしきい値を設定して、ドキュメントが人間による検証に到達するかどうかを決定できます。検証ルールの設定方法について詳しくは、「 構造を確立する」の「検証の設定」セクションをご覧ください。
- 次のいずれかのアクティビティを追加します。
- 検証ステーションで検証する検証ステーションを提示します。
- Action Center で検証する検証タスクを作成します。
- Apps で検証するドキュメント検証成果物を作成します。
この検証手順では、ここに示す以外のアクティビティを使用することもできます。詳しくは、以下のリソースをご覧ください。
検証ステーション
Action Center
Apps (アプリ)
クロスプラットフォーム プロジェクト用の IXP の非構造化ドキュメントや複雑なドキュメントのワークフローを構築するには、以下の手順に従います。
IXP 非構造化ドキュメントや複雑なドキュメントのモデルを利用するワークフローを使用する場合、 検証ステーション は、抽出されたデータをレビュー、確認、改良するための重要なインターフェイスとして機能します。検証ステーション には、モデルがドキュメントをどのように解釈したかが表示されるため、抽出の精度を理解して、不確実な領域を特定し、必要に応じて修正を行うことができます。
検証ステーションでは、各ドキュメントの種類とそれに対応するフィールドが、抽出された値および信頼度インジケーターとともに表示されます。OCR エンジンと抽出モデルの両方から導き出されるこれらの信頼度レベルにより、抽出されたデータの信頼性を検証できます。
検証プロセスについて詳しくは、以下のリソースをご覧ください。
以下の表に、Windows プロジェクトとクロスプラットフォーム プロジェクトの IXP ワークフローの比較を示します。
| Windows | クロスプラットフォーム | |
|---|---|---|
| 必要なパッケージ |
|
|
| タクソノミーを定義する | [タクソノミー マネージャー] オプションを使用して、表のフィールドを手動で編集できます。
注: タクソノミー マネージャーは 、 Intelligent OCR パッケージがインストールされている場合にのみ利用できます。
| Document Understanding パッケージを使用すると、[ドキュメント データを抽出] アクティビティに IXP モデルのタクソノミー フィールドが自動的に表示されます。 |
| スタジオの種類 | デスクトップ版の Studio での使用をお勧めします。 | Studio Web での使用をお勧めします。 |