UiPath Documentation
document-understanding
2024.10
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
UiPath logo, featuring letters U and I in white

Document Understanding ガイド

最終更新日時 2026年4月6日

キーワード ベースの分類器

キーワード ベースの分類器とは

The Keyword Based Classifier is a simple classifier that searches for repeating string sequences within a given file, in order to perform document classification.

このアルゴリズムは、ドキュメントのタイトルの概念を基に構築されており、タイトルを持つドキュメントの種類は、それらのタイトルのドキュメントでの表示方法にそれほど違いがないことを前提としています。

ファイルをドキュメントの種類に分類する際、キーワード ベースの分類器は以下を行います。

  • 学習データから、タクソノミーのドキュメントの種類に該当する、最も一致する文字列または文字列コレクションを検索します。信頼度は以下に基づいて計算されます。
    • ドキュメントの先頭にどれだけ一致しているか
    • Knowledge Workers によって一致が確認され、学習データで強化された回数
  • 最もスコアが高いドキュメントの種類と、元になる一致設定を報告します。

キーワード ベースの分類器は、単一の文字列エントリ (分類器が使用している学習データで、1 つのエントリと見なされる 1 つの文字列) または複数の文字列を含むエントリ (1 つのエントリを構成する 2 つ以上の文字列) を使用できます。複数の文字列の場合、分類器は各文字列に個別にマッチング アルゴリズムを適用してから、特定された一致の信頼度の単純な平均値を計算します。

次の例を見てみましょう。

  • if an entry contains a single string, for instance, "this is my match", then the Keyword Based Classifier searches and rates this string as a potential document type match (according to which document type the string is attributed to).
  • if an entry contains three strings, for instance, ["this is a match", "needs more evidence for filtering", "yet another one"], then the Keyword Based Classifier searches and rates each one of the three strings, and then computes a simple average of the matching confidences for reporting.

キーワード セットは、1 行で定義することも、複数行を使用して定義することもできます。1 行で定義されている場合は、指定されたそれぞれのキーワードが検索されます。たとえば、x、y、z をキーワードとして指定すると、x と y と z が検索されます。

複数の行で定義されている場合は、1 行目から順番に最後の行まで、指定されているすべてのキーワードが検索され、最も多くのキーワードに一致している文字列が特定されます。したがって、より多くのキーワードを使用してより多くの一致する文字列を特定すれば、信頼度スコアが上昇します。

使用すべきタイミング

以下の場合、この分類器の使用を検討する必要があります。

  • ファイルに含まれるドキュメントの種類は 1 つだけで、ファイルの分割が不要な場合。
  • ファイルの最初の 3 ページに、ドキュメントの種類に関連する証拠が含まれる場合。

特別な要件

キーワード ベースの分類器を使用するための特別な要件はありません。

For more information on how to train a Classifier, check this page that describes the process of using the Manage Learning wizard.

  • キーワード ベースの分類器とは
  • 使用すべきタイミング
  • 特別な要件

このページは役に立ちましたか?

接続

ヘルプ リソース サポート

学習する UiPath アカデミー

質問する UiPath フォーラム

最新情報を取得