Document Understanding - データ抽出トレーニングの概要

document-understanding

latest

false

Document Understanding クラシックユーザーガイド

重要 :

このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。新しいコンテンツの翻訳は、およそ 1 ～ 2 週間で公開されます。

データ抽出トレーニングの概要

Document Understanding フレームワークのデータ抽出トレーニングコンポーネントです。人間からのフィードバックによって学習ループが閉じられ、時間の経過とともに抽出器のパフォーマンスがどのように向上するかを説明します。

データ抽出トレーニングとは

データ抽出トレーニングは、Document Understanding^TM フレームワークのコンポーネントです。人間によるフィードバックから学習する能力を持つ抽出器のフィードバックループを閉じるのに役立つます。このトレーニングは、追加のドキュメントに対する抽出器のパフォーマンスを (それぞれの学習能力に応じて) 向上させるのに役立ちます。

データ抽出トレーニングを使用すべき場合

トレーニングコンポーネントを含まない Document Understanding プロセスが構築される場合があります。これは、いくつかの理由で起きる可能性があります。その一部を以下に示します。

使用している抽出器が再トレーニングをサポートしていない
再トレーニングを実行するのではなく、プロセスでは常に同じトレーニングを使用したい
抽出器トレーニングをオフラインで更新したいと考えており、その更新を DU プロセス外で管理している

しかし、ほとんどの場合、通常のプロセス使用の一環として抽出器をトレーニングすることには、大きなメリットがあります。抽出器は人間による検証情報を取り込んで、独自のトレーニングデータを収集し、独自の更新を実行できるからです。ユーザーが何らかの方法で既存のワークフローを更新する必要はありません。抽出器は、人間が正しいデータとして検証したデータに基づいて、将来より適切に機能するよう自ら学ぶことができる、自己学習型アルゴリズムになります。

データ抽出トレーニングコンポーネントの使用方法

データ抽出トレーニングは、[抽出器トレーニングスコープ] アクティビティを使用して行われます。このスコープアクティビティには、一度に 1 つ以上の抽出器トレーニングアルゴリズムを設定して実行する役割があるため、1 つ以上の抽出器をトレーニングできます。

データ抽出トレーニングは通常、データ抽出の検証後に実行されます。アルゴリズムが受け取るトレーニングデータの精度を確保するため、トレーニング用には、人間が確認したフィードバックのみを分類器に送り返す必要があります。

データ抽出トレーニングは、自動的に抽出されたデータが正しい (修正が不要) 場合だけでなく、人間による修正の場合にも実行する必要があります。これは、どちらのケースもアルゴリズムの学習に役立つためです。

データ抽出コンポーネントで使用されている抽出器と、データ抽出の予測に使用されていない抽出器の両方をトレーニングできます。後者のアプローチは、後で Document Understanding ワークフローに追加して使用するために、トレーニングデータを収集して、ゼロから抽出器をトレーニングする場合に使用されます。

[抽出器トレーニングスコープ] で行われることを、以下に簡潔にまとめます。

すべての抽出器トレーナー (トレーニングアルゴリズム) の実行に必要な設定を指定します。
1 つ以上の抽出器トレーナーを受け入れます。
ドキュメントの種類とフィールドレベルのフィルター処理、およびプロジェクトのタクソノミーと内部抽出器のタクソノミーの間のマッピングを可能にします。

[抽出器トレーニングスコープ] は、[抽出器を設定] ウィザードを使用して抽出器を設定できます。以下をカスタマイズできます。

トレーニングのために、どのドキュメントの種類およびどのフィールドが、どの抽出器トレーナーに送信されるか
ドキュメントの種類のレベルおよびフィールドレベルでの、プロジェクトのタクソノミーと抽出器の内部タクソノミー (ある場合) 間のタクソノミーマッピング

抽出器トレーニングスコープでは、抽出器 - 抽出器トレーナーのアクティビティのペアを一意に特定することもでき、そのためにデータ抽出器スコープとトレーニングスコープの両方で同じフレームワークエイリアス文字列が使用されます。

利用可能な抽出器トレーナー

現在、トレーニング/再トレーニング機能が備わっているのは、マシンラーニング抽出器だけです。このアクティビティは UiPath.DocumentUnderstanding.ML.Activities パッケージ内にあり、そのトレーニングアクティビティをマシンラーニング抽出器トレーナーと呼びます。

データ抽出トレーニングとは
データ抽出トレーニングを使用すべき場合
データ抽出トレーニングコンポーネントの使用方法
利用可能な抽出器トレーナー

このページは役に立ちましたか?

前へ[抽出器トレーニングスコープ] の抽出器を設定ウィザード

次へデータ抽出トレーニング関連のアクティビティ

データ抽出トレーニングとは​

データ抽出トレーニングを使用すべき場合​

データ抽出トレーニング コンポーネントの使用方法​

利用可能な抽出器トレーナー​

このページは役に立ちましたか?

データ抽出トレーニングとは

データ抽出トレーニングを使用すべき場合

データ抽出トレーニングコンポーネントの使用方法

利用可能な抽出器トレーナー