Document Understanding アクティビティ

最終更新日時 2025年4月16日

キーワードベースの分類器

UiPath.IntelligentOCR.Activities.DocumentClassification.KeywordBasedClassifier

説明

このアクティビティの機能は次のとおりです。

キーワードベースのドキュメント分類アルゴリズムを組み込み、繰り返し可能なタイトルを持つファイルの分類をターゲットにします。
[ドキュメント分類スコープ] アクティビティの内部で使用されている場合、指定されたファイルにある、指定されたトレーニングセットに基づいてドキュメントを分類します。

このアクティビティは、[ドキュメント分類スコープ] アクティビティと [分類器トレーニングスコープ] アクティビティと併用する場合のみ使用できます。

プロジェクトの対応 OS

Windows - レガシ | Windows

構成

デザイナーパネル

ラーニングファイルのパス - 分類器データを含むファイルへのフルパスです。このフィールドは、文字列と String 型変数のみをサポートします。
注:
一度に設定できるのは、上記のパラメーターのうち 1 つだけです。[ラーニングデータ] 文字列または [ラーニングファイルのパス] 文字列のいずれかを使用できます。

[ラーニングファイルのパス] は分類器データを取得する場所から場所を指定します。

[ラーニングデータ] は、その分類器の実際の情報が含まれています。

プロパティパネル

共通

表示名 - アクティビティの表示名です。

入力

ラーニングデータ - シリアル化された分類器のデータを含む文字列です。このフィールドは、文字列と String 型変数のみをサポートします。
ラーニングファイルのパス - 分類器データを含むファイルへのフルパスです。このフィールドは、文字列と String 型変数のみをサポートします。
注:
一度に設定できるのは、上記のパラメーターのうち 1 つだけです。[ラーニングデータ] 文字列または [ラーニングファイルのパス] 文字列のいずれかを使用できます。

[ラーニングファイルのパス] は分類器データを取得する場所から場所を指定します。

[ラーニングデータ] は、その分類器の実際の情報が含まれています。

プライベート - オンにした場合、変数および引数の値が Verbose レベルでログに出力されなくなります。
注: ベストプラクティスは、その場所に空の .json ファイルを作成し、その名前を [ラーニングファイルのパス] フィールドに使用することです。

[学習を管理] ウィザードの使用

キーワードベースの分類器は、設計時にアクティビティの 学習を管理ウィザードにアクセスするだけで設定できます。このウィザードは、ドキュメント分類トレーニングフェーズで収集されたデータをレビューする際にも使用できます。それには、更新されたラーニングファイルのパスでウィザードを開きます。

このウィザードを使用すると、このアクティビティでドキュメントの種類を識別するために使用されるキーワードを設定および管理できます。ファイルパスを編集する必要性に合わせて作成されました。代わりに変数付きの学習データ パラメーターが使用される場合、特定のファイルパスを編集するか、この操作を中止するかを確認されます。

注: キーワードベースの分類器学習ウィザードは、ファイルパスを編集および構成する場合のみ使用できます。

[キーワードベースの分類器] または [キーワードベースの分類器トレーナー] アクティビティをワークフローに追加します。
.json ファイルのパスを追加して、[キーワードベースの分類器] アクティビティを構成します。分類器を構成する際は、以下の情報を考慮に入れてください。
- パスが指定されておらず、[学習を管理] オプションが選択されると、ラーニングファイルのパスの入力を確認するポップアップが表示されます。パスが指定されると、ウィザードが開きます。
- .json ファイルではなく変数を追加できますが、ウィザードが LearningData 変数に学習パターンを適用することはできないため、編集できる特定のファイルのパスを要求します。
[学習を管理] を選択します。
キーワードベースの分類器学習を管理ウィザードのウィンドウが開きます。
図 1. キーワードベースの分類器学習を管理ウィザードの概要
パスが指定されておらず、[学習を管理] オプションが選択されると、ラーニングファイルのパスを確認するポップアップが表示されます。パスが指定されると、ウィザードが開きます。
図 2. パスが指定されていない場合に [学習を管理] オプションを選択すると表示される警告ポップアップ

注: .json ファイルが使用できない場合でも、新しい .json ファイルの名前をアクティビティに直接追加することができ、.json ファイルが、指定されたフォルダー内に自動的に作成されます。

ドキュメントの種類にキーワードを追加する

ウィザードには、タクソノミーで定義した数のドキュメントの種類カテゴリがあります。ドキュメントの種類ごとに 1 つまたは複数のキーワードを追加できます。このアクティビティは特定のドキュメントのキーワードを学習し、後でこれらのルールに基づいて特定の種類のドキュメントを識別および分類することができます。

すべてのエントリは、"" (引用符) で囲んだ文字列として入力する必要があります。単一の値を追加することも、複数の値を追加することもできます。キーワードを追加または削除するには、ウィザードで次の手順を実行します。

[新しいキーワードセットを追加] を選択して、そのカテゴリに余分なフィールドを追加します。
フィールドとそのキーワードを削除するには、アイコンを選択します。
ウィザードの設定を保存するには、[保存] を選択します。追加されたすべての値は、プロジェクトの .json ファイルにあります。
注: キーワードを管理 ウィザードのキーワードの一部として入力された二重引用符は、C# フレーバーのプロジェクトであっても、Visual Basic の規則 (二重二重引用符) に従い常にエスケープされます。