document-understanding
latest
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
UiPath logo, featuring letters U and I in white

Document Understanding ガイド

最終更新日時 2025年12月23日

タクソノミー マネージャー

重要: Intel Xe GPU を使用していて、タクソノミー マネージャーが正しく表示されない場合は、グラフィック ドライバーを最新バージョンに更新することをお勧めします。詳しくは、こちらのページをご覧ください。

タクソノミー マネージャーを使用して、現在の自動化プロジェクト独自のタクソノミー ファイルを作成・編集できます。このタクソノミー ファイルにはユーザーが定義したドキュメントの種類が含まれ、それらはグループ別とカテゴリ別に整理されています。

[タクソノミーを読み込み] アクティビティを使ってタクソノミー ファイルを .NET データ型に変換して、次のアクティビティの入力値として渡すことで、このタクソノミー ファイルを使用できます。

タクソノミー マネージャーは、v1.6.0 またはそれ以降の UiPath.IntelligentOCR.Activities パッケージをプロジェクトの依存関係としてインストールした後でのみ使用できます。パッケージをインストールすると、[ウィザード] セクションのリボンに [タクソノミー マネージャー] ボタンが表示されます。



タクソノミー マネージャーを使用する

[タクソノミー マネージャー] ウィンドウでは、ドキュメントの種類を作成し、グルーブ別とカテゴリ別で整理することができます。プロジェクトでこのウィンドウを初めて開いたときには、グループ、カテゴリ、ドキュメントの種類のいずれも定義されていません。

Figure 1. The Taxonomy Manager before mapping any document types or fields

構造を確立する

最初の手順として、グループまたはドキュメントの種類を作成します。これら 2 つの違いは、グループは階層構造になっており、ドキュメントの種類は単一のファイルとして作成できる点です。複雑なプロジェクトの場合はグループ、カテゴリ、ドキュメントの種類を作成する必要がありますが、簡易なプロジェクトで必要になるのは 1 つまたは 2 つのドキュメントの種類のみです。

グループを作成する

グループを作成すると、グループ内に作成するドキュメントの種類のカテゴリも必要になります。それには、[グループ] ボタンを使用します。グループの名前を選択したら、[保存] ボタンを使用するか Enter キーを使用して保存できます。

カテゴリを作成する

グループを定義して選択したら、定義済みのボタンを使用して、グループ内に [カテゴリ] または [ドキュメントの種類] (あるいはその両方) を作成できます。[保存] を選択するか、Enter キーを使用して設定を保存します。

ドキュメントの種類を作成する

ドキュメントの種類は、グループの一部または 1 つのドキュメントとして作成できます。グループ内に作成した場合は、グループが選択されていることを確認して、[ドキュメントの種類] を選択します。

ドキュメントの種類を 1 つのファイルとして作成する場合は、グループが選択されていないことを確認して、[ドキュメントの種類] を選択します。[ドキュメントの種類] を選択したら、ファイルの名前を入力して [保存] を選択します。

注: Studio v2020.10 の使用時に Orchestrator から Document Understanding アクションを送信する場合は、カテゴリのないドキュメントの種類がタクソノミーに作成されていないことを確認してください。

すでに作成済みのドキュメントの種類を選択して、名前を変更したり、一意の ID をクリップボードにコピーしたり、それを別のグループまたはカテゴリに再割り当てしたりすることができます。ドキュメントの種類のコードを入力することもできます。

ドキュメントの種類を保存すると、[ドキュメントの種類の ID] が生成されます。編集のためにドキュメントを開くと、[ドキュメントの種類名] タブの横にこの ID が表示されます。[ドキュメントの種類の ID] は種類が Group.Category.Document の構造をしており、クリップボードにコピーできます。 [ドキュメントの種類の ID] コードは任意の機能であり、この機能を使用してドキュメントを検索したり、ドキュメントを分類データで定義するドキュメントの種類にマップできます。
ドキュメントの種類の表示設定を構成する
ドキュメントの種類を作成した後に、その表示設定を構成できます。タクソノミー マネージャーでドキュメントの種類を選択し、[表示設定] に移動します。次の設定を変更できます。
  • OCR の信頼度のしきい値: ドキュメントの種類のレベルで最小の信頼度のしきい値を設定します。

    ドキュメントを検証ステーションに表示する場合、フィールドの [OCR の信頼度] のレベルと [抽出結果の信頼度] レベルの両方が、タクソノミー マネージャーで設定したしきい値よりも高い必要があります。

    [OCR の信頼度のしきい値] の既定値は 90% です。

  • 日付の表示形式: ドキュメントの種類に対して表示される日付形式です。
    既定値は YYYY-MM-DD です。
  • 数値の小数点区切り文字: ドキュメントの種類に対して使用する、数値の小数点区切り文字です。
  • 数値の 3 桁区切り文字: ドキュメントの種類に対して使用する、数値の 3 桁区切り文字です。
フィールドを作成する

[ドキュメントの種類] を選択すると、[フィールド] ボタンを使用して新しいフィールドを作成できるようになります。[フィールド] ボタンを選択したら、名前を入力し、ドロップダウン リストから種類を選択できます。

[フィールド] カテゴリには、[詳細][ルール] の 2 つのタブがあります。[詳細] タブには、選択したフィールドに関する情報としてフィールド名、割り当てられたホットキー、フィールドの種類などが表示されます。[ルール] タブでは、フィールドの抽出結果が満たす必要があるルールを作成できます。

次のフィールドの種類を使用できます。

  • テキスト
  • Number
  • Date - この型を選択すると、期待される形式も指定できます (任意)。
    注:

    予想される形式を追加する場合は、MSDN (MicroSoft Developer Network) 準拠の形式を使用してください。

    This format may be used by extractors and is used by the Data Extraction Scope activity when trying to parse a Date into its constituent Day, Month, and Year parts.

  • 名前
  • Address
  • Set - この型を選択すると、事前設定されたリストからこのフィールドに複数の値を追加できます。
  • Boolean
  • Table - この型を選択すると、表の構造を編集できます。列を追加して、列の名前や種類を編集できます。

詳細タブ

新しいフィールドが作成されたら、選択して詳細を表示します。既定では、フィールドを開くと [詳細] タブが表示され、フィールドの名前、色、またはホットキーを変更できます。また、フィールドに複数の値が含まれているかどうか ([複数値である]) や、ドキュメント内に証拠のない値の処理を許可するかどうか ([参照が必要]) も指定できます。複数値オプションを使用すると、特定の値のリストに限定されることなく、複数の値をフィールドに含めることができます。

2 つのフィールドの使用方法について詳しくは、以下の説明をご覧ください。
  • 複数値である: フィールドが複数値として設定されている場合、その特定のフィールドに対して複数の値を報告できます。たとえば、エントリ数が可変の「取締役のリスト」を抽出するとします。単一列の表のような複数値フィールドを想像してみてください。
  • 参照が必要: フィールドに参照が必要な場合、検証ステーションに表示されているドキュメントから選択しない限り、フィールドに値を追加できません。 特殊なフィールドにおいて、ドキュメントに表示されない可能性がある値をキャプチャする場合は、[参照が必要]オフに切り替えることができます。 その効果として、ユーザーがその値の取得元であるドキュメント内の場所を指定せずに値を追加できるようになります。

また、ドロップダウン リストからフィールドの [種類] を選択するか、[既定値] を追加することもできます。ドキュメント内で特定されたフィールドに値がない場合に、[抽出結果] に入力される値を定義するには、[既定値] フィールドを使用します。

検証の設定

[検証の設定] には、抽出結果の信頼度のしきい値を設定するためのオプションがあります。このしきい値は、検証ステーションでフィールドを検証するときに考慮されます。抽出結果の信頼度のしきい値を設定するには、[抽出結果の信頼度のしきい値] に移動し、0 から 100 の範囲の値を入力します。

Figure 2. Overview of the Details tab of a field

検証者のコメントは、[詳細] タブから有効化できます。検証者のコメントを設定すると、人間の検証者は検証中に行った意思決定に関するメモを追加できます。次の設定を使用できます。
  • 読み取り専用: 有効化すると、[抽出結果] フィールドに設定されている検証メモをメッセージとして、人間の検証者に検証ステーションで表示できます。無効化すると (既定のステート)、人間の検証者は検証ステーションでそのメモを編集して、意思決定に関する情報をロボットに伝えることができます。
  • テキスト: テキスト を選択すると、検証者のコメントが検証ステーションにテキスト メッセージ (編集が有効化されている場合は編集可能なテキスト) として表示されます。 人間の検証者は、検証ステーションで最大 200 文字のメッセージを表示、編集、または追加できます。
  • オプション: [オプション] を選択すると、一連のラジオ ボタンを設定できます。これらのボタンは人間の検証者に表示され、読み取り専用でない場合は検証ステーションで選択できます。最大 10 個のオプションを追加できます。
Tip: Check the ExtractionResult Class page from the UiPath.DocumentProcessing.Contracts section for more information on the two methods related to validator notes, GetFieldValidatorNotes(<fieldId>) and SetFieldValidatorNotes(<fieldId>, <validatorNote>).

作成したフィールドは、フィールドの横にある削除ボタンを使用して削除したり、ドラッグ アンド ドロップ機能を使用して並べ替えたりすることができます。

フィールドは [詳細] タブの [削除] を選択して削除することもできます。

この手順を繰り返すことにより、複数のグループ、カテゴリ、ドキュメントの種類を作成できます。これらは、[検索] フィールドを使用することでフィルター処理できます。

ルール タブ

フィールド ルールは、抽出結果を最適化しワークフロー実行時に自動的に検証するのに役立ちます。抽出を効率よく行い、検証ステーションで必要なフィールドを強調表示して人間が簡単に検証できるようにする役割があります。1 つのフィールドにつき複数のルールを作成して適用できます。

ルールを定義するには、[エバリュエーターの種類][重要度レベル] を設定します。

エバリュエーターの種類

エバリュエーターの種類を選択して、定義したルールの評価方法を指定します。AND または OR の 2 種類から選択できます。

表 1. [エバリュエーターの種類]、その説明、および例を示す表

エバリュエーターの種類

説明

AND

すべてのルールを実行する必要がある場合は、このエバリュエーターの種類を使用します。

ルール: 請求書番号は A で始まり X で終わる

  • 有効な結果: 有効なフィールド値は A123X です。
  • 無効な結果: 有効なフィールド値は A123 です。

OR

実行するルールが 1 つだけの場合は、このエバリュエーターの種類を使用します。

ルール: 請求書番号は A または 123 で始まる

  • 有効な結果: 有効なフィールド値は A123、123 です。
  • 無効な結果: 有効なフィールド値は 234、1A23 です。

重要度レベル

フィールドに定義されたすべてのルールの重要度を示します。検証ステーション セッションでルールが満たされていない場合は、MUST レベルを設定することはできません。重要度レベルは MUST または SHOULD の 2 種類から選択できます。

作成したルールは、設定した重要度レベルが識別されるとトリガーされます。

ルールを送信する際、MUST レベルのルールは 100% 満たされている必要があります。満たされていない場合、送信操作は失敗します。SHOULD レベルのルールの場合は、ルールが満たされていなくても送信できます。

You can always check if a rule is broken by using the helper method from the ExtractionResult Class class, that resides in the UiPath.DocumentProcessing.Contracts activity package.

表 2. [重要度レベル] とその説明を表示する表
 

説明

MUST

作成したルールが抽出結果プロセスに必ず含まれていなければならない場合は、この重要度レベルを使用します。

SHOULD

作成したルールが任意の場合は、この重要度レベルを使用します。

[エバリュエーターの種類][重要度レベル] を選択したら、新たに作成したルールの種類を設定する必要があります。選択できるオプションは複数あります。以下に、利用可能なすべてのオプションのリストを示します。

  • 空でない
  • 予想される値
  • 次で始まる
  • 次で終わる
  • 次の値を含む
  • 固定長
  • メール アドレス
  • 正規表現
    注: ルールを作成したフィールドの種類によって、選択できるルールの種類の数が決定されます。たとえば、Text フィールドの場合はすべてのルールの種類が表示されますが、Date フィールドの場合は [空でない][予想される値] の 2 種類しか表示されません。

ルールの種類

次の表に、利用可能な各ルールの種類の詳細を、重要度レベルとエバリュエーターの種類に基づいて分類して示します。
表 3. ルールの種類とその説明 (重要度レベルとエバリュエーターの種類に基づく)
 説明フィールドの種類重要度レベルエバリュエーターの種類
空でない抽出された値は空にすることはできません。つまり、フィールドは必須です。 値が見つからない場合は、検証/手動の入力が必要です。 以下の型のフィールドに適用できます。
  • Number
  • text
  • Date
  • アドレス
  • name
  • Set
  • Boolean

MUST

SHOULD

AND

OR

予想される値予想されるすべての値をユーザーが定義します。抽出されるデータはルールの作成時に入力として追加された値の 1 つです (たとえば、Employee Type (従業員の種類) は「full-time (フルタイム)」、「part-time (パートタイム)」、「internship (インターンシップ)」のいずれかです)。 以下の型のフィールドに適用できます。
  • Number
  • text
  • Date

MUST

SHOULD

AND

OR

データを抽出するルールとして機能する数式を定義します。 number 型のフィールドに適用できます。
ルールの設定時に条件が必要です。 次のいずれかのオプションを選択します。
  • 次の値に等しい
  • 次の値と等しくない
  • 次の値より大きい
  • 次の値以上
  • 次の値以下
数式は必須です。定義済みの演算子を使用して式を定義します。以下の例をご覧ください。
  • 合計 * 正味単価\n- 合計 = 小計 + 納品
  • 割引 - Sum 演算子は、表の列からすべての値を収集します。

MUST

SHOULD

AND

OR

次で始まるこれは固定のルールです。つまり、抽出された値は、ユーザーが追加した値のいずれかから開始する必要があります。 以下の型のフィールドに適用できます。
  • text
  • アドレス
  • name

MUST

SHOULD

AND

OR

次で終わるこれは、抽出された値がユーザーによって追加された値のいずれかで終わる必要があることを意味する固定のルールです。 以下の型のフィールドに適用できます。
  • text
  • アドレス
  • name

MUST

SHOULD

AND

OR

次の値を含むこれは、抽出された値がユーザーによって追加された値のいずれかを含む必要があることを意味する、固定のルールです。 以下の型のフィールドに適用できます。
  • text
  • アドレス
  • name

MUST

SHOULD

AND

OR

固定長これは、抽出された値が特定の固定長である必要があることを意味する固定のルールです。 以下の型のフィールドに適用できます。
  • text
  • アドレス
  • name

MUST

SHOULD

AND

OR

メール アドレスこれは、抽出された値がメール形式で記述されている必要があることを意味する固定のルールです。 以下の型のフィールドに適用できます。
  • text
  • アドレス
  • name

MUST

SHOULD

AND

OR

正規表現これは、抽出された値がユーザーによって追加された値のいずれかに類似する正規表現を含む必要があることを意味する、固定のルールです。 以下の型のフィールドに適用できます。
  • text
  • アドレス
  • name

MUST

SHOULD

AND

OR

ルールを使用する

実際の例を見ながら、ルールの適用性について理解を深めましょう。ドキュメントの [アドレス] フィールドの一連のルールを作成します。フィールドに対して 1 つの新しいルールまたは一連のルールを作成する方法については、以下の手順の例をご覧ください。
  1. [タクソノミー] パネルでフィールドを選択します。
  2. [ルール] タブに移動します。
  3. [新規追加] を選択して、新しいルールを追加します。
  4. [種類][次の値を含む] で、[式]st, str, street である full address ルールを入力します。
  5. [エバリュエーターの種類] を選択します。

    この例では、[OR] を選択します。

  6. [重要度レベル] を選択します。

    この例では、[MUST (高)] を選択します。

  7. [新規追加] を選択します。
  8. phone number ルールを入力します。この場合、[種類][空でない] です。
  9. [新規追加] を選択します。
  10. [種類][次の値を含む] で、[式]city, state である city or state ルールを入力します。

以下のアニメーション画像は、前述の手順を示しています。

Figure 3. Animated image displaying how to add three rules for a field

その他のオプション

編集中

作成したグループ、カテゴリ、またはドキュメントの種類の名前を編集できます。それには、設定の 3 つのレベルのいずれかを選択し [名前] フィールドを編集します。

削除しています。

グループ、カテゴリ、ドキュメントの種類を削除することもできます。次の 2 つの利用可能なオプションがあります。

  • 削除するオブジェクトの親要素で [削除] 削除 を選択します。
  • 削除するオブジェクトを選択しながら、[削除] 削除 を選択します。

どちらの場合も、削除操作を確認するよう求めるポップアップが表示されます。[削除] を選択して操作を承認します。

カスタマイズとアクセシビリティ

新しく作成したフィールドには、ホットキーと色が自動的に割り当てられます。これらを使用して、可視性を向上させ、分類データ間をすばやく移動できます。ホットキーまたは色コード フィールドをクリックして、フィールドをカスタマイズします。

A customized field with color and hotkey can instruct the Validation Station and the Template Manager to use the assigned color when displaying the field and to use the assigned hotkey as a shortcut for providing values to fields. See the Validation Station page for more information about how to use the field shortcuts to assign values to a field.

フィールドに色とホットキーを割り当てるには、フィールドを選択し、[色] フィールドで特定のカラー コードを選択してから、[ホットキー] メニューから特定のホットキーを選択します。

キーボード ショートカットを使用して、タクソノミー マネージャー内を移動できます。[使用可能なキーボード ショートカットを表示] を選択し、[キーボード ショートカットを有効化] オプションをアクティブにして、キーボード ショートカットが誤ってトリガーされないようにします。ノードは折りたたむこともできます。

注: タクソノミー マネージャーで行った変更は、プロジェクト独自の taxonomy.json ファイルに自動的に保存されます。
  • タクソノミー マネージャーを使用する
  • 構造を確立する

このページは役に立ちましたか?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
Uipath Logo
信頼とセキュリティ
© 2005-2025 UiPath. All rights reserved.