Document Understanding ガイド

インテリジェントキーワード分類器

インテリジェントキーワード分類器とは

インテリジェントキーワード分類器は、特定のドキュメントの種類のファイルから学習した単語ベクトルを使用して、ドキュメントの分類を実行する分類器です。

このアルゴリズムは、同じドキュメントの種類に対してコンテンツを繰り返すという概念を基に構築されており、ドキュメントの種類にはそれらのドキュメントの種類で通常発生する一連の単語があることを前提としています。これにより、ベクトル類似度の計算が可能になっています。

ファイルをドキュメントの種類に分類する際、インテリジェントキーワード分類器は以下を行います。

ファイルが最も類似する単語ベクトルを検索します。
最もスコアが高いドキュメントの種類と、元になる主な一致単語を報告します。

インテリジェントキーワード分類器 にはファイル分割機能もあるため、特定のファイルの別個のページ範囲に対して複数のクラスを報告できます。

使用すべきタイミング

以下の場合、この分類器の使用を検討する必要があります。

単一ファイルに 1 つ以上のドキュメントの種類が含まれる場合
コンテンツに関する限り、ドキュメントの種類を比較的容易に区別できる場合

特別な要件

この分類器を使用するには、Automation Cloud Document Understanding の API キーを使用するか、オンプレミスの AI Center でインテリジェントキーワード分類器の独自インスタンスをホストする必要があります。

トレーニング方法

[インテリジェントキーワード分類器トレーナー] アクティビティを [分類器トレーニングスコープ] 内に配置して、適宜設定します。

並行して実行される複数のトレーニングにおいて、トレーニングファイルの整合性をアクティビティレベルで確保することはできません。この問題の 2 つの解決策が、Document Understanding Process (Studio テンプレート) で提供されています。どちらの解決策も、トラフィック制御によるものです。

ファイルをロックする (プロセス内で既定で実行): 拡張子 .lock を使用してファイル名を変更し、ファイルを修正後に保存します。次に、再度ファイル名を変更し、拡張子 .lock を削除します。
特殊キューを手動で設定する: Orchestrator 内に空のキューを作成し、プロジェクトの 2 つのアクティビティを統合します。

分類器のトレーニング方法について詳しくは、学習を管理ウィザードの使用方法について説明しているこちらのページをご覧ください。

詳しく読む

インテリジェントキーワード分類器について詳しくは、こちらをご覧ください。

インテリジェントキーワード分類器とは
使用すべきタイミング
特別な要件
トレーニング方法
詳しく読む

このページは役に立ちましたか?

前へキーワードベースの分類器

次へFlexiCapture 分類器