activities

latest

false

重要 :

このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。新しいコンテンツの翻訳は、およそ 1 ～ 2 週間で公開されます。

Document Understanding アクティビティ

最終更新日時 2025年10月28日

タクソノミーを読み込み

UiPath.IntelligentOCR.Activities.TaxonomyManagement.LoadTaxonomy

タクソノミーマネージャーを使用して作成した taxonomy.json ファイルを変数に変換して、他のアクティビティでも再利用できるようにします。

プロパティ

共通

表示名 - アクティビティの表示名です。

その他

プライベート - オンにした場合、変数および引数の値が Verbose レベルでログに出力されなくなります。

出力

分類データ - 読み込む分類データです。DocumentTaxonomy 変数に格納されます。この出力結果は後ほど、分類データを入力値として受け取るアクティビティで使用されます。

重要: Intel Xe GPU を使用していて、タクソノミーマネージャーが正しく表示されない場合は、グラフィックドライバーを最新バージョンに更新することをお勧めします。詳しくは、こちらのページをご覧ください。

タクソノミー拡張メソッド

Serialize(): DocumentTaxonomy オブジェクトで呼び出されます。Serialize() メソッドは、オブジェクトの JSON 表現を返します。これを格納しておけば、後で取得して使用できます。
Deserialize(String): DocumentTaxonomy.Deserialize(jsonString) 静的拡張メソッドは、DocumentTaxonomy オブジェクトを返します。このオブジェクトは、パラメーターとして渡された JSON エンコードデータでハイドレートされます。
GetFields(String): DocumentTaxonomy オブジェクトで呼び出されます。DocumentTypeId 文字列で呼び出された GetFields() メソッドは、そのドキュメントの種類内で定義されたフィールドのリストを返します。

タクソノミーマネージャーを使用して、現在の自動化プロジェクト独自のタクソノミーファイルを作成・編集できます。このタクソノミーファイルにはユーザーが定義したドキュメントの種類が含まれ、それらはグループ別とカテゴリ別に整理されています。

[タクソノミーを読み込み] アクティビティを使ってタクソノミーファイルを .NET データ型に変換して、次のアクティビティの入力値として渡すことで、このタクソノミーファイルを使用できます。

タクソノミーマネージャーは、v1.6.0 またはそれ以降の UiPath.IntelligentOCR.Activities パッケージをプロジェクトの依存関係としてインストールした後でのみ使用できます。パッケージをインストールすると、[ウィザード] セクションのリボンに [タクソノミーマネージャー] ボタンが表示されます。

図 1. Studio のリボンのタクソノミーマネージャーの概要

タクソノミーマネージャーを使用する

[タクソノミーマネージャー] ウィンドウでは、ドキュメントの種類を作成し、グルーブ別とカテゴリ別で整理することができます。プロジェクトでこのウィンドウを初めて開いたときには、グループ、カテゴリ、ドキュメントの種類のいずれも定義されていません。

図 2. ドキュメントの種類またはフィールドをマッピングする前のタクソノミーマネージャー

構造を確立する

最初の手順として、グループまたはドキュメントの種類を作成します。これら 2 つの違いは、グループは階層構造になっており、ドキュメントの種類は単一のファイルとして作成できる点です。複雑なプロジェクトの場合はグループ、カテゴリ、ドキュメントの種類を作成する必要がありますが、簡易なプロジェクトで必要になるのは 1 つまたは 2 つのドキュメントの種類のみです。

グループを作成する

グループを作成すると、グループ内に作成するドキュメントの種類のカテゴリも必要になります。それには、[グループ] ボタンを使用します。グループの名前を選択したら、[保存] ボタンを使用するか Enter キーを使用して保存できます。

カテゴリを作成する

グループを定義して選択したら、定義済みのボタンを使用して、グループ内に [カテゴリ] または [ドキュメントの種類] (あるいはその両方) を作成できます。[保存] を選択するか、Enter キーを使用して設定を保存します。

ドキュメントの種類を作成する

ドキュメントの種類は、グループの一部または 1 つのドキュメントとして作成できます。グループ内に作成した場合は、グループが選択されていることを確認して、[ドキュメントの種類] を選択します。

ドキュメントの種類を 1 つのファイルとして作成する場合は、グループが選択されていないことを確認して、[ドキュメントの種類] を選択します。[ドキュメントの種類] を選択したら、ファイルの名前を入力して [保存] を選択します。

注: Studio v2020.10 の使用時に Orchestrator から Document Understanding アクションを送信する場合は、カテゴリのないドキュメントの種類がタクソノミーに作成されていないことを確認してください。

すでに作成済みのドキュメントの種類を選択して、名前を変更したり、一意の ID をクリップボードにコピーしたり、それを別のグループまたはカテゴリに再割り当てしたりすることができます。ドキュメントの種類のコードを入力することもできます。

ドキュメントの種類を保存すると、[ドキュメントの種類の ID] が生成されます。編集のためにドキュメントを開くと、[ドキュメントの種類名] タブの横にこの ID が表示されます。[ドキュメントの種類の ID] は種類が Group.Category.Document の構造をしており、クリップボードにコピーできます。 [ドキュメントの種類の ID] コードは任意の機能であり、この機能を使用してドキュメントを検索したり、ドキュメントを分類データで定義するドキュメントの種類にマップできます。

ドキュメントの種類の表示設定を構成する

ドキュメントの種類を作成した後に、その表示設定を構成できます。タクソノミーマネージャーでドキュメントの種類を選択し、[表示設定] に移動します。次の設定を変更できます。

OCR の信頼度のしきい値: ドキュメントの種類のレベルで最小の信頼度のしきい値を設定します。
ドキュメントを検証ステーションに表示する場合、フィールドの [OCR の信頼度] のレベルと [抽出結果の信頼度] レベルの両方が、タクソノミーマネージャーで設定したしきい値よりも高い必要があります。

[OCR の信頼度のしきい値] の既定値は 90% です。
日付の表示形式: ドキュメントの種類に対して表示される日付形式です。
既定値は YYYY-MM-DD です。
数値の小数点区切り文字: ドキュメントの種類に対して使用する、数値の小数点区切り文字です。
数値の 3 桁区切り文字: ドキュメントの種類に対して使用する、数値の 3 桁区切り文字です。

フィールドを作成する

[ドキュメントの種類] を選択すると、[フィールド] ボタンを使用して新しいフィールドを作成できるようになります。[フィールド] ボタンを選択したら、名前を入力し、ドロップダウンリストから種類を選択できます。

[フィールド] カテゴリには、[詳細] と [ルール] の 2 つのタブがあります。[詳細] タブには、選択したフィールドに関する情報としてフィールド名、割り当てられたホットキー、フィールドの種類などが表示されます。[ルール] タブでは、フィールドの抽出結果が満たす必要があるルールを作成できます。

次のフィールドの種類を使用できます。

テキスト
Number
Date - この型を選択すると、期待される形式も指定できます (任意)。
注:
予想される形式を追加する場合は、MSDN (MicroSoft Developer Network) 準拠の形式を使用してください。

これは抽出器が使用可能な形式であり、[データ抽出スコープ] アクティビティが日付を解析して、日、月、年の各構成要素への分解を試みるときに使用されます。
名前
Address
Set - この型を選択すると、事前設定されたリストからこのフィールドに複数の値を追加できます。
Boolean
Table - この型を選択すると、表の構造を編集できます。列を追加して、列の名前や種類を編集できます。

詳細タブ

新しいフィールドが作成されたら、選択して詳細を表示します。既定では、フィールドを開くと [詳細] タブが表示され、フィールドの名前、色、またはホットキーを変更できます。また、フィールドに複数の値が含まれているかどうか ([複数値である]) や、ドキュメント内に証拠のない値の処理を許可するかどうか ([参照が必要]) も指定できます。複数値オプションを使用すると、特定の値のリストに限定されることなく、複数の値をフィールドに含めることができます。

2 つのフィールドの使用方法について詳しくは、以下の説明をご覧ください。

複数値である: フィールドが複数値として設定されている場合、その特定のフィールドに対して複数の値を報告できます。たとえば、エントリ数が可変の「取締役のリスト」を抽出するとします。単一列の表のような複数値フィールドを想像してみてください。
参照が必要: フィールドに参照が必要な場合、検証ステーションに表示されているドキュメントから選択しない限り、フィールドに値を追加できません。特殊なフィールドにおいて、ドキュメントに表示されない可能性がある値をキャプチャする場合は、[参照が必要] をオフに切り替えることができます。その効果として、ユーザーがその値の取得元であるドキュメント内の場所を指定せずに値を追加できるようになります。

また、ドロップダウンリストからフィールドの [種類] を選択するか、[既定値] を追加することもできます。ドキュメント内で特定されたフィールドに値がない場合に、[抽出結果] に入力される値を定義するには、[既定値] フィールドを使用します。

検証の設定

[検証の設定] には、抽出結果の信頼度のしきい値を設定するためのオプションがあります。このしきい値は、検証ステーションでフィールドを検証するときに考慮されます。抽出結果の信頼度のしきい値を設定するには、[抽出結果の信頼度のしきい値] に移動し、0 から 100 の範囲の値を入力します。

図 3. フィールドの [詳細] タブの概要

検証者のコメントは、[詳細] タブから有効化できます。検証者のコメントを設定すると、人間の検証者は検証中に行った意思決定に関するメモを追加できます。次の設定を使用できます。

読み取り専用: 有効化すると、[抽出結果] フィールドに設定されている検証メモをメッセージとして、人間の検証者に検証ステーションで表示できます。無効化すると (既定のステート)、人間の検証者は検証ステーションでそのメモを編集して、意思決定に関する情報をロボットに伝えることができます。
テキスト: テキスト を選択すると、検証者のコメントが検証ステーションにテキストメッセージ (編集が有効化されている場合は編集可能なテキスト) として表示されます。人間の検証者は、検証ステーションで最大 200 文字のメッセージを表示、編集、または追加できます。
オプション: [オプション] を選択すると、一連のラジオボタンを設定できます。これらのボタンは人間の検証者に表示され、読み取り専用でない場合は検証ステーションで選択できます。最大 10 個のオプションを追加できます。

ヒント: 検証者のコメントに関連する 2 つのメソッド「GetFieldValidatorNotes(<fieldId>)」と「SetFieldValidatorNotes(<fieldId>, <validatorNote>)」について詳しくは、UiPath.DocumentProcessing.Contracts セクションの「ExtractionResult クラス」をご覧ください。

作成したフィールドは、フィールドの横にある削除ボタンを使用して削除したり、ドラッグアンドドロップ機能を使用して並べ替えたりすることができます。

フィールドは [詳細] タブの [削除] を選択して削除することもできます。

この手順を繰り返すことにより、複数のグループ、カテゴリ、ドキュメントの種類を作成できます。これらは、[検索] フィールドを使用することでフィルター処理できます。

ルールタブ

フィールドルールは、抽出結果を最適化しワークフロー実行時に自動的に検証するのに役立ちます。抽出を効率よく行い、検証ステーションで必要なフィールドを強調表示して人間が簡単に検証できるようにする役割があります。1 つのフィールドにつき複数のルールを作成して適用できます。

ルールを定義するには、[エバリュエーターの種類] と [重要度レベル] を設定します。

エバリュエーターの種類

エバリュエーターの種類を選択して、定義したルールの評価方法を指定します。AND または OR の 2 種類から選択できます。

表 1. **[エバリュエーターの種類]**、その説明、および例を示す表
エバリュエーターの種類	説明	例
AND	すべてのルールを実行する必要がある場合は、このエバリュエーターの種類を使用します。	ルール: 請求書番号は A で始まり X で終わる有効な結果: 有効なフィールド値は A123X です。無効な結果: 有効なフィールド値は A123 です。
OR	実行するルールが 1 つだけの場合は、このエバリュエーターの種類を使用します。	ルール: 請求書番号は A または 123 で始まる有効な結果: 有効なフィールド値は A123、123 です。無効な結果: 有効なフィールド値は 234、1A23 です。

重要度レベル

フィールドに定義されたすべてのルールの重要度を示します。検証ステーションセッションでルールが満たされていない場合は、MUST レベルを設定することはできません。重要度レベルは MUST または SHOULD の 2 種類から選択できます。

作成したルールは、設定した重要度レベルが識別されるとトリガーされます。

ルールを送信する際、MUST レベルのルールは 100% 満たされている必要があります。満たされていない場合、送信操作は失敗します。SHOULD レベルのルールの場合は、ルールが満たされていなくても送信できます。

ルールが満たされているかどうかは、UiPath.DocumentProcessing.Contracts アクティビティパッケージ内の ExtractionResult Class クラスのヘルパーメソッドを使用して確認できます。

表 2. **[重要度レベル]** とその説明を表示する表
	説明
MUST	作成したルールが抽出結果プロセスに必ず含まれていなければならない場合は、この重要度レベルを使用します。
SHOULD	作成したルールが任意の場合は、この重要度レベルを使用します。

[エバリュエーターの種類] と [重要度レベル] を選択したら、新たに作成したルールの種類を設定する必要があります。選択できるオプションは複数あります。以下に、利用可能なすべてのオプションのリストを示します。

空でない
予想される値
次で始まる
次で終わる
次の値を含む
固定長
メールアドレス
正規表現
注: ルールを作成したフィールドの種類によって、選択できるルールの種類の数が決定されます。たとえば、Text フィールドの場合はすべてのルールの種類が表示されますが、Date フィールドの場合は [空でない] と [予想される値] の 2 種類しか表示されません。

ルールの種類

次の表に、利用可能な各ルールの種類の詳細を、重要度レベルとエバリュエーターの種類に基づいて分類して示します。

表 3. ルールの種類とその説明 (重要度レベルとエバリュエーターの種類に基づく)
	説明	フィールドの種類	重要度レベル	エバリュエーターの種類
空でない	抽出された値は空にすることはできません。つまり、フィールドは必須です。値が見つからない場合は、検証/手動の入力が必要です。	以下の型のフィールドに適用できます。 Number text Date アドレス name Set Boolean	MUST SHOULD	AND OR
予想される値	予想されるすべての値をユーザーが定義します。抽出されるデータはルールの作成時に入力として追加された値の 1 つです (たとえば、Employee Type (従業員の種類) は「full-time (フルタイム)」、「part-time (パートタイム)」、「internship (インターンシップ)」のいずれかです)。	以下の型のフィールドに適用できます。 Number text Date	MUST SHOULD	AND OR
式	データを抽出するルールとして機能する数式を定義します。	number 型のフィールドに適用できます。ルールの設定時に条件が必要です。次のいずれかのオプションを選択します。次の値に等しい次の値と等しくない次の値より大きい次の値以上次の値以下数式は必須です。定義済みの演算子を使用して式を定義します。以下の例をご覧ください。合計 * 正味単価\n- 合計 = 小計 + 納品割引 - Sum 演算子は、表の列からすべての値を収集します。	MUST SHOULD	AND OR
次で始まる	これは固定のルールです。つまり、抽出された値は、ユーザーが追加した値のいずれかから開始する必要があります。	以下の型のフィールドに適用できます。 text アドレス name	MUST SHOULD	AND OR
次で終わる	これは、抽出された値がユーザーによって追加された値のいずれかで終わる必要があることを意味する固定のルールです。	以下の型のフィールドに適用できます。 text アドレス name	MUST SHOULD	AND OR
次の値を含む	これは、抽出された値がユーザーによって追加された値のいずれかを含む必要があることを意味する、固定のルールです。	以下の型のフィールドに適用できます。 text アドレス name	MUST SHOULD	AND OR
固定長	これは、抽出された値が特定の固定長である必要があることを意味する固定のルールです。	以下の型のフィールドに適用できます。 text アドレス name	MUST SHOULD	AND OR
メールアドレス	これは、抽出された値がメール形式で記述されている必要があることを意味する固定のルールです。	以下の型のフィールドに適用できます。 text アドレス name	MUST SHOULD	AND OR
正規表現	これは、抽出された値がユーザーによって追加された値のいずれかに類似する正規表現を含む必要があることを意味する、固定のルールです。	以下の型のフィールドに適用できます。 text アドレス name	MUST SHOULD	AND OR

ルールを使用する

実際の例を見ながら、ルールの適用性について理解を深めましょう。ドキュメントの [アドレス] フィールドの一連のルールを作成します。フィールドに対して 1 つの新しいルールまたは一連のルールを作成する方法については、以下の手順の例をご覧ください。

[タクソノミー] パネルでフィールドを選択します。
[ルール] タブに移動します。
[新規追加] を選択して、新しいルールを追加します。
[種類] が [次の値を含む] で、[式] が st, str, street である full address ルールを入力します。
[エバリュエーターの種類] を選択します。
この例では、[OR] を選択します。
[重要度レベル] を選択します。
この例では、[MUST (高)] を選択します。
[新規追加] を選択します。
phone number ルールを入力します。この場合、[種類] は [空でない] です。
[新規追加] を選択します。
[種類] が [次の値を含む] で、[式] が city, state である city or state ルールを入力します。

以下のアニメーション画像は、前述の手順を示しています。

図 4. フィールドに 3 つのルールを追加する方法を示すアニメーション画像

その他のオプション

編集中

作成したグループ、カテゴリ、またはドキュメントの種類の名前を編集できます。それには、設定の 3 つのレベルのいずれかを選択し [名前] フィールドを編集します。

削除しています。

グループ、カテゴリ、ドキュメントの種類を削除することもできます。次の 2 つの利用可能なオプションがあります。

削除するオブジェクトの親要素で [削除] を選択します。
削除するオブジェクトを選択しながら、[削除] を選択します。

どちらの場合も、削除操作を確認するよう求めるポップアップが表示されます。[削除] を選択して操作を承認します。

カスタマイズとアクセシビリティ

新しく作成したフィールドには、ホットキーと色が自動的に割り当てられます。これらを使用して、可視性を向上させ、分類データ間をすばやく移動できます。ホットキーまたは色コードフィールドをクリックして、フィールドをカスタマイズします。

色とホットキーでカスタマイズされたフィールドによって、フィールドを表示する際に割り当てられた色を使用するよう、および割り当てられたホットキーをフィールドに値を指定するためのショートカットとして使用するよう、検証ステーションとテンプレートマネージャーに指示できます。フィールドのショートカットを使用してフィールドに値を割り当てる方法の詳細については、「検証ステーション」をご覧ください。

フィールドに色とホットキーを割り当てるには、フィールドを選択し、[色] フィールドで特定のカラーコードを選択してから、[ホットキー] メニューから特定のホットキーを選択します。

キーボードショートカットを使用して、タクソノミーマネージャー内を移動できます。[使用可能なキーボードショートカットを表示] を選択し、[キーボードショートカットを有効化] オプションをアクティブにして、キーボードショートカットが誤ってトリガーされないようにします。ノードは折りたたむこともできます。

注: タクソノミーマネージャーで行った変更は、プロジェクト独自の taxonomy.json ファイルに自動的に保存されます。

プロパティ
タクソノミー拡張メソッド
タクソノミーマネージャーを使用する
構造を確立する

このページは役に立ちましたか?

前へアクティビティ

次へドキュメントをデジタル化

サポートとサービス

サポートを受ける

UiPath アカデミー

RPA について学ぶ - オートメーションコース

UiPath コミュニティフォーラム

Document Understanding アクティビティ

タクソノミーを読み込み

プロパティ

共通

その他

出力

タクソノミー拡張メソッド

タクソノミー マネージャーを使用する

構造を確立する

グループを作成する

カテゴリを作成する

ドキュメントの種類を作成する

ドキュメントの種類の表示設定を構成する

フィールドを作成する

検証の設定

その他のオプション

このページは役に立ちましたか?

タクソノミーマネージャーを使用する