アクティビティ
最新
バナーの背景画像
Document Understanding アクティビティ
最終更新日 2024 年 4 月 10 日

タクソノミーを読み込み

UiPath.IntelligentOCR.Activities.TaxonomyManagement.LoadTaxonomy

タクソノミー マネージャーを使用して作成した taxonomy.json ファイルを変数に変換して、他のアクティビティでも再利用できるようにします。

プロパティ

共通
  • 表示名 - アクティビティの表示名です。
その他
  • プライベート - オンにした場合、変数および引数の値が Verbose レベルでログに出力されなくなります。
出力
  • 分類データ - 読み込む分類データです。DocumentTaxonomy 変数に格納されます。この出力結果は後ほど、分類データを入力値として受け取るアクティビティで使用されます。
    重要: Intel Xe GPU を使用していて、タクソノミー マネージャーが正しく表示されない場合は、グラフィック ドライバーを最新バージョンに更新することをお勧めします。詳しくは、こちらのページをご覧ください。

タクソノミー拡張メソッド

Serialize()
DocumentTaxonomy オブジェクトで呼び出されます。Serialize() メソッドは、オブジェクトの JSON 表現を返します。これを格納しておけば、後で取得して使用できます。
Deserialize(String)
DocumentTaxonomy.Deserialize(jsonString) スタティック拡張は、DocumentTaxonomy オブジェクトを返します。このオブジェクトは、パラメーターとして渡された JSON エンコードデータでハイドレートされています。
GetFields(String)
DocumentTaxonomy オブジェクトで呼び出されます。DocumentTypeId 文字列で呼び出された GetFields() メソッドは、そのドキュメントの種類内で定義されたフィールドのリストを返します。

タクソノミー マネージャーを使用して、現在の自動化プロジェクト独自のタクソノミー ファイルを作成・編集できます。このタクソノミー ファイルにはユーザーが定義したドキュメントの種類が含まれ、それらはグループ別とカテゴリ別に整理されています。

[タクソノミーを読み込み] アクティビティを使ってタクソノミー ファイルを .NET データ型に変換して、次のアクティビティの入力値として渡すことで、このタクソノミー ファイルを使用できます。

タクソノミー マネージャーは、v1.6.0 またはそれ以降の UiPath.IntelligentOCR.Activities パッケージをプロジェクトの依存関係としてインストールした後でのみ使用できます。パッケージをインストールすると、[ウィザード] セクションのリボンに [タクソノミー マネージャー] ボタンが表示されます。



タクソノミー マネージャーを使用する

[タクソノミー マネージャー] ウィンドウでは、ドキュメントの種類を作成し、グルーブ別とカテゴリ別で整理することができます。プロジェクトでこのウィンドウを初めて開いたときには、グループ、カテゴリ、ドキュメントの種類のいずれも定義されていません。



構造を確立する

最初の手順として、グループまたはドキュメントの種類を作成します。これら 2 つの違いは、グループは階層構造になっており、ドキュメントの種類は単一のファイルとして作成できる点です。複雑なプロジェクトの場合はグループ、カテゴリ、ドキュメントの種類を作成する必要がありますが、簡易なプロジェクトで必要になるのは 1 つまたは 2 つのドキュメントの種類のみです。

グループを作成する

グループを作成したら、グループ内に作成するドキュメントの種類のカテゴリも必要になります。それには、[グループ] ボタンを使用します。グループの名前を選択したら、[保存] ボタンを使用するか、Enter キーを押して、これを保存します。



カテゴリを作成する

グループを定義して選択したら、定義済みのボタンを使用して、グループ内に [カテゴリ] または [ドキュメントの種類] (あるいはその両方) を作成できます。



ドキュメントの種類を作成する

ドキュメントの種類は、グループの一部または 1 つのドキュメントとして作成できます。グループ内に作成した場合は、グループが選択されていることを確認して、[ドキュメントの種類] ボタンをクリックします。

ドキュメントの種類を 1 つのファイルとして作成する場合は、グループが選択されていないことを確認して、[ドキュメントの種類] ボタンをクリックします。[ドキュメントの種類] ボタンをクリックしたら、ファイルの名前を入力して [保存] ボタンをクリックします。



注: Studio v20.10 の使用時に Orchestrator から Document Understanding アクションを送信する場合は、カテゴリのないドキュメントの種類がタクソノミーに作成されないようにしてください。

既に作成済みのドキュメントの種類を選択して、名前を変更したり、一意の ID をクリップボードにコピーしたり、それを別のグループまたはカテゴリに再割り当てしたりする (またはどこにも割り当てない) ことができます。ドキュメントの種類のコードを入力することもできます。

ドキュメントの種類を保存すると、[ドキュメントの種類の ID] が生成されます。編集のためにドキュメントを開くと、[ドキュメントの種類名] タブの横にこの ID が表示されます。[ドキュメントの種類の ID] は種類が Group.Category.Document の構造をしており、クリップボードにコピーできます。 [ドキュメントの種類の ID] コードは任意の機能であり、この機能を使用してドキュメントを検索したり、ドキュメントを分類データで定義するドキュメントの種類にマップできます。


フィールドを作成する

[ドキュメントの種類] を選択すると、[フィールド] ボタンを使用して新しいフィールドを作成できるようになります。[フィールド] ボタンをクリックしたら、名前を入力し、ドロップダウン リストから種類を選択できます。

[フィールド] カテゴリには、[詳細][ルール] の 2 つのタブがあります。[詳細] タブには、選択したフィールドに関する情報としてフィールド名、割り当てられたホットキー、フィールドの種類などが表示されます。[ルール] タブでは、フィールドの抽出結果が満たす必要があるルールを作成できます。

使用可能なフィールドの種類は次のとおりです。

  • テキスト
  • Number
  • Date - この種類を選択すると、想定する形式も選択できます (任意)。
    注:

    予想される形式を追加する場合は、MSDN 準拠の形式を使用してください。

    これは抽出器が使用可能な形式であり、[データ抽出スコープ] アクティビティが日付を解析して、日、月、年の各構成要素への分解を試みるときに使用されます。

  • 名前
  • アドレス
  • Set - この種類を選択すると、事前設定されたリストからこのフィールドに複数の値を追加できます。
  • Boolean
  • Table - この種類を選択すると、表の構造を編集できます。列を追加して、列の名前や種類を編集できます。


詳細タブ

新しいフィールドが作成されたら、クリックして詳細を表示します。既定では、フィールドを開くと [詳細] タブが表示され、フィールドの名前、色、またはホットキーを変更できます。また、フィールドに複数の値が含まれているかどうか ([複数値である]) や、ドキュメント内に証拠のない値の処理を許可するかどうか ([参照が必要]) も指定できます。複数値オプションを使用すると、特定の値のリストに限定されることなく、複数の値をフィールドに含めることができます。

2 つのフィールドの使用方法について詳しくは、以下の説明をご覧ください。
  • 複数値である: フィールドが複数値として設定されている場合、その特定のフィールドに対して複数の値を報告できます。 例: エントリ数は可変の「取締役のリスト」を抽出するとします。 単一列のテーブルのような複数値フィールドを想像してみてください。
  • 参照が必要: フィールドに参照が必要な場合、検証ステーションに表示されているドキュメントから選択しない限り、フィールドに値を追加できません。 特殊なフィールドにおいて、ドキュメントに表示されない可能性がある値をキャプチャする場合は、[参照が必要]オフに切り替えることができます。 その効果として、ユーザーがその値の取得元であるドキュメント内の場所を指定せずに値を追加できるようになります。


検証者のコメントは、[詳細] タブから有効化できます。検証者のコメントを設定すると、人間の検証者は検証中に行った意思決定に関するメモを追加できます。次の設定を使用できます。
  • 読み取り専用: 有効化すると、[抽出結果] フィールドに設定されている検証メモをメッセージとして、人間の検証者に検証ステーションで表示できます。無効化すると (既定のステート)、人間の検証者は検証ステーションでそのメモを編集して、意思決定に関する情報をロボットに伝えることができます。
  • テキスト: テキスト を選択すると、検証者のコメントが検証ステーションにテキスト メッセージ (編集が有効化されている場合は編集可能なテキスト) として表示されます。 人間の検証者は、検証ステーションで最大 200 文字のメッセージを表示、編集、または追加できます。
  • オプション: [オプション] を選択すると、一連のラジオ ボタンを設定できます。これらのボタンは人間の検証者に表示され、読み取り専用でない場合は検証ステーションで選択できます。最大 10 個のオプションを追加できます。
ヒント: 検証者のコメントに関連する 2 つのメソッド「GetFieldValidatorNotes(<fieldId>)」と「SetFieldValidatorNotes(<fieldId>, <validatorNote>)」について詳しくは、UiPath.DocumentProcessing.Contracts セクションの「ExtractionResult クラス」 をご覧ください。

作成したフィールドは、フィールドの横にある削除ボタンを使用して削除したり、ドラッグ アンド ドロップ機能を使用して並べ替えたりすることができます。



フィールドは [詳細] タブの [削除] ボタンを選択して削除することもできます。



この手順を繰り返すことにより、複数のグループ、カテゴリ、ドキュメントの種類を作成できます。これらは、[検索] フィールドを使用することでフィルター処理できます。

ルール タブ

フィールド ルールは、抽出結果を最適化しワークフロー実行時に自動的に検証するのに役立ちます。抽出を効率よく行い、検証ステーションで必要なフィールドを強調表示して人間が簡単に検証できるようにする役割があります。1 つのフィールドにつき複数のルールを作成して適用できます。

ルールを定義するには、[エバリュエーターの種類][重要度レベル] を設定します。

エバリュエーターの種類

エバリュエーターの種類を選択して、定義したルールの評価方法を指定します。AND または OR の 2 種類から選択できます。

エバリュエーターの種類

説明

AND

すべてのルールを実行する必要がある場合は、このエバリュエーターの種類を使用します。

ルール: 請求書番号は A で始まり X で終わる

  • 有効な結果: 有効なフィールド値は A123X です。
  • 無効な結果: 有効なフィールド値は A123 です。

OR

実行するルールが 1 つだけの場合は、このエバリュエーターの種類を使用します。

ルール: 請求書番号は A または 123 で始まる

  • 有効な結果: 有効なフィールド値は A123、123 です。
  • 無効な結果: 有効なフィールド値は 234、1A23 です。

重要度レベル

フィールドに定義されたすべてのルールの重要度を示します。検証ステーション セッションでルールが満たされていない場合は、MUST レベルを設定することはできません。重要度レベルは MUST または SHOULD の 2 種類から選択できます。

作成したルールは、設定した重要度レベルが識別されるとトリガーされます。

ルールを送信する際、MUST レベルのルールは 100% 満たされている必要があります。満たされていない場合、送信操作は失敗します。SHOULD レベルのルールの場合は、ルールが満たされていなくても送信できます。

ルールが満たされているかどうかは、UiPath.DocumentProcessing.Contracts アクティビティ パッケージ内の ExtractionResult Class クラスのヘルパー メソッドを使用して確認できます。

重要度レベル

説明

MUST

作成したルールが抽出結果プロセスに必ず含まれていなければならない場合は、この重要度レベルを使用します。

SHOULD

作成したルールが任意の場合は、この重要度レベルを使用します。

[エバリュエーターの種類][重要度レベル] を選択したら、新たに作成したルールの種類を設定する必要があります。選択できるオプションは複数あります。以下に、利用可能なすべてのオプションのリストを示します。

  • 空でない
  • 予想される値
  • 次で始まる
  • 次で終わる
  • 次の値を含む
  • 固定長
  • メール アドレス
  • 正規表現
    注: ルールを作成したフィールドの種類によって、選択できるルールの種類の数が決定されます。たとえば、Text フィールドの場合はすべてのルールの種類が表示されますが、Date フィールドの場合は [空でない] と [予想される値] の 2 種類しか表示されません。

ルールの種類

以下に、クリティカルレベルに応じて分類される、利用可能なすべてのルールの種類のリストを示します。
ルールの種類説明フィールドの種類重要度レベルエバリュエーターの種類
空でない抽出された値は空にすることはできません。つまり、フィールドは必須です。 値が見つからない場合は、検証/手動の入力が必要です。 種類が以下のフィールドに適用されます。
  • Number
  • text
  • Date
  • アドレス
  • name
  • Set
  • Boolean

MUST

SHOULD

AND

OR

予想される値ユーザーはすべての可能な値を定義し、抽出されたデータは、ルールの作成時に入力として追加された値の 1 つです (例: 雇用主の場合は「フルタイム」「パートタイム」「インターンシップ」のいずれかです。 種類が以下のフィールドに適用されます。
  • Number
  • text
  • Date

MUST

SHOULD

AND

OR

データを抽出するルールとして機能する数式を定義します。 種類が以下のフィールドに適用されます。
  • Number
ルールの設定時に条件が必要です。 次のいずれかのオプションを選択します。
  • 次の値に等しい
  • 次の値と等しくない
  • 次の値より大きい
  • 次の値以上
  • 次の値以下
数式が必要です。 定義済みの演算子を使用して、式を定義します。 以下に、その例を示します。
  • 合計 * 正味単価\n- 合計 = 小計 + 納品
  • 割引 - Sum 演算子は、表の列からすべての値を収集します。

MUST

SHOULD

AND

OR

次で始まるこれは固定のルールです。つまり、抽出された値は、ユーザーが追加した値のいずれかから開始する必要があります。 種類が以下のフィールドに適用されます。
  • text
  • アドレス
  • name

MUST

SHOULD

AND

OR

次で終わるこれは、抽出された値がユーザーによって追加された値のいずれかで終わる必要があることを意味する固定のルールです。 種類が以下のフィールドに適用されます。
  • text
  • アドレス
  • name

MUST

SHOULD

AND

OR

次の値を含むこれは、抽出された値がユーザーによって追加された値のいずれかを含む必要があることを意味する、固定のルールです。 種類が以下のフィールドに適用されます。
  • text
  • アドレス
  • name

MUST

SHOULD

AND

OR

固定長これは、抽出された値が特定の固定長である必要があることを意味する固定のルールです。 種類が以下のフィールドに適用されます。
  • text
  • アドレス
  • name

MUST

SHOULD

AND

OR

メール アドレスこれは、抽出された値がメール形式で記述されている必要があることを意味する固定のルールです。 種類が以下のフィールドに適用されます。
  • text
  • アドレス
  • name

MUST

SHOULD

AND

OR

正規表現これは、抽出された値がユーザーによって追加された値のいずれかに類似する正規表現を含む必要があることを意味する、固定のルールです。 種類が以下のフィールドに適用されます。
  • text
  • アドレス
  • name

MUST

SHOULD

AND

OR

ルールを使用する

実際の例を見ながら、ルールの適用性について理解を深めましょう。フィールドのルールを作成する方法は次のとおりです。


docs image
その他のオプション

編集中

作成したグループ、カテゴリ、またはドキュメントの種類の名前を編集できます。それには、設定の 3 つのレベルのいずれかを選択し [名前] フィールドを編集します。


docs image

削除しています。

グループ、カテゴリ、ドキュメントの種類を削除することもできます。次の 2 つの利用可能なオプションがあります。

  • docs image ボタンをクリックします。


  • ウィンドウの右上側にある docs image [削除] ボタンをクリックします。


どちらの場合も、削除操作を確認するよう求めるポップアップが表示されます。上の GIF に示すように、[削除] をクリックして操作を承認します。

カスタマイズとアクセシビリティ

新しく作成したフィールドには、ホットキーと色が自動的に割り当てられます。これらを使用して、可視性を向上させ、分類データ間をすばやく移動できます。ホットキーまたは色コード フィールドをクリックして、フィールドをカスタマイズします。

色とホットキーでカスタマイズされたフィールドによって、フィールドを表示する際に割り当てられた色を使用するよう、および割り当てられたホットキーをフィールドに値を指定するためのショートカットとして使用するよう、検証ステーションとテンプレート マネージャーに指示できます。フィールドのショートカットを使用してフィールドに値を割り当てる方法の詳細については、こちらをご覧ください。



キーボード ショートカットを使用して、タクソノミー マネージャー内を移動できます。[キーボード ショートカットを切り替え] オプションを有効化すると、キーボード ショートカットを誤ってトリガーするのを避けることができます。1 回のクリックでノードを折りたたむこともできます。



使用可能なすべてのキーボード ショートカットをわかりやすく示します。



注: タクソノミー マネージャーで行った変更は、プロジェクト独自の taxonomy.json ファイルに自動的に保存されます。

Was this page helpful?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
UiPath ロゴ (白)
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.