Document Understanding - ドキュメント分類トレーニングの概要

document-understanding

2021.10

false

Document Understanding ガイド

重要 :

このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。新しいコンテンツの翻訳は、およそ 1 ～ 2 週間で公開されます。

ドキュメント分類トレーニングの概要

ドキュメント分類トレーニングとは

ドキュメント分類トレーニングは、人間によるフィードバックから学習できる分類器のフィードバックループを閉じるのに役立つ Document Understanding フレームワークのコンポーネントです。

分類トレーニングを使用すべき場合

トレーニングコンポーネントを含まない Document Understanding プロセスが構築される場合があります。これは、いくつかの理由で起きる可能性があります。その一部を以下に示します。

使用している分類器が再トレーニングをサポートしていない
再トレーニングを実行するのではなく、プロセスでは常に同じトレーニングを使用したい
分類器トレーニングをオフラインで更新することを希望しており、その更新を DU プロセス外で管理している

しかし、ほとんどの場合、通常のプロセス使用の一環として分類器をトレーニングすることには、大きなメリットがあります。分類器は人間による検証情報を取り込んで、独自のトレーニングデータを収集し、独自の更新を実行できるからです。ユーザーが何らかの方法で既存のワークフローを更新する必要はありません。分類器は、人間が正しいデータとして検証したデータに基づいて、将来より適切に機能するよう自ら学ぶことができる、自己学習型アルゴリズムになります。

ドキュメント分類トレーニングコンポーネントの使用方法

分類トレーニングは、[分類器トレーニングスコープ] アクティビティを使用して行われます。このスコープアクティビティには、一度に 1 つ以上の分類トレーニングアルゴリズムを設定して実行する役割があるため、1 つ以上の分類器をトレーニングできます。

分類トレーニングは通常、ドキュメント分類の検証後に実行されます。アルゴリズムが受け取るトレーニングデータの精度を確保するため、トレーニング用には、人間が確認したフィードバックのみを分類器に送り返す必要があります。

分類トレーニングは、分類に失敗したケース (自動分類なし、または Knowledge Workers によって修正された自動分類) と、成功したケース (検証段階でユーザーによる修正が行われず、すべての自動結果が確認された) の両方で実行する必要があります。これは、どちらのケースもアルゴリズムの学習に役立つためです。

ドキュメント分類フェーズで使用された分類器と、分類予測に使用されていない分類器の両方をトレーニングできます。後者のアプローチは、後で Document Understanding ワークフローに追加して使用するために、トレーニングデータを収集して、最初から分類器をトレーニングする場合に使用されます。

[分類器トレーニングスコープ] で行われることを、以下に簡潔にまとめます。

すべての分類器トレーナー (トレーニングアルゴリズム) の実行に必要な設定を指定します。
1 つ以上の分類器トレーナーを受け入れます。
ドキュメントの種類のフィルター処理、およびプロジェクトのタクソノミーと内部分類器のタクソノミーの間のマッピングを可能にします。

[分類器トレーニングスコープ] は、分類器を設定ウィザードを使用して設定できます。以下をカスタマイズできます。

トレーニングのために、どのドキュメントの種類が、どの分類器トレーナーに送信されるか
ドキュメントの種類のレベルでの、プロジェクトのタクソノミーと分類器の内部タクソノミー間のマッピング (ある場合)

使用可能な分類器トレーナー

分類器およびそれぞれのトレーナーアクティビティは、UiPath.IntelligentOCR.Activities パッケージに含まれています。

使用可能な分類器トレーナーは、次のとおりです。

キーワードベースの分類器トレーナー。キーワードベースの分類器のトレーナーアクティビティです。
インテリジェントキーワード分類器トレーナー。インテリジェントキーワード分類器のトレーナーアクティビティです。

ドキュメント分類トレーニングとは
分類トレーニングを使用すべき場合
ドキュメント分類トレーニングコンポーネントの使用方法
使用可能な分類器トレーナー

このページは役に立ちましたか?

前へドキュメント分類トレーニング

次へ[分類器トレーニングスコープ] の分類器を設定ウィザード