- リリース ノート
- Document Processing Contracts について
- プレビュー版リリース
- Box クラス
- IPersistedActivity インターフェイス
- PrettyBoxConverter クラス
- IClassifierActivity インターフェイス
- IClassifierCapabilitiesProvider インターフェイス
- ClassifierDocumentType クラス
- ClassifierResult クラス
- ClassifierCodeActivity クラス
- ClassifierNativeActivity クラス
- ClassifierAsyncCodeActivity クラス
- ClassifierDocumentTypeCapability クラス
- ExtractorAsyncCodeActivity クラス
- ExtractorCodeActivity クラス
- ExtractorDocumentType クラス
- ExtractorDocumentTypeCapabilities クラス
- ExtractorFieldCapability クラス
- ExtractorNativeActivity クラス
- ExtractorResult クラス
- ICapabilitiesProvider インターフェイス
- IExtractorActivity インターフェイス
- ExtractorPayload クラス
- DocumentActionPriority 列挙型
- DocumentActionData クラス
- DocumentActionStatus 列挙型
- DocumentActionType 列挙型
- DocumentClassificationActionData クラス
- DocumentValidationActionData クラス
- UserData クラス
- Document クラス
- DocumentSplittingResult クラス
- DomExtensions クラス
- Page クラス
- PageSection クラス
- Polygon クラス
- PolygonConverter クラス
- Metadata クラス
- WordGroup クラス
- Word クラス
- ProcessingSource 列挙型
- ResultsTableCell クラス
- ResultsTableValue クラス
- ResultsTableColumnInfo クラス
- ResultsTable クラス
- Rotation 列挙型
- SectionType 列挙型
- WordGroupType 列挙型
- IDocumentTextProjection インターフェイス
- ClassificationResult クラス
- ExtractionResult クラス
- ResultsDocument クラス
- ResultsDocumentBounds クラス
- ResultsDataPoint クラス
- ResultsValue クラス
- ResultsContentReference クラス
- ResultsValueTokens クラス
- ResultsDerivedField クラス
- ResultsDataSource 列挙型
- ResultConstants クラス
- SimpleFieldValue クラス
- TableFieldValue クラス
- DocumentGroup クラス
- DocumentTaxonomy クラス
- DocumentType クラス
- Field クラス
- FieldType 列挙型
- LanguageInfo クラス
- MetadataEntry クラス
- TextType 列挙型
- TypeField クラス
- ITrackingActivity インターフェイス
- ITrainableActivity インターフェイス
- ITrainableClassifierActivity インターフェイス
- ITrainableExtractorActivity インターフェイス
- TrainableClassifierAsyncCodeActivity クラス
- TrainableClassifierCodeActivity クラス
- TrainableClassifierNativeActivity クラス
- TrainableExtractorAsyncCodeActivity クラス
- TrainableExtractorCodeActivity クラス
- TrainableExtractorNativeActivity クラス
- リリース ノート
- OCR コントラクトについて
- プロジェクトの対応 OS
- IOCRActivity インターフェイス
- OCRAsyncCodeActivity クラス
- OCRCodeActivity クラス
- OCRNativeActivity クラス
- Character クラス
- OCRResult クラス
- Word クラス
- FontStyles 列挙型
- OCRRotation 列挙型
- OCRCapabilities クラス
- OCRScrapeBase クラス
- OCRScrapeFactory クラス
- ScrapeControlBase クラス
- ScrapeEngineUsages 列挙型
- ScrapeEngineBase
- ScrapeEngineFactory クラス
- ScrapeEngineProvider クラス
タクソノミーを読み込み
UiPath.IntelligentOCR.Activities.TaxonomyManagement.LoadTaxonomy
タクソノミー マネージャーを使用して作成した taxonomy.json
ファイルを変数に変換して、他のアクティビティでも再利用できるようにします。
プロパティ
共通
- 表示名 - アクティビティの表示名です。
その他
- プライベート - オンにした場合、変数および引数の値が Verbose レベルでログに出力されなくなります。
出力
-
分類データ - 読み込む分類データです。
DocumentTaxonomy
変数に格納されます。この出力結果は後ほど、分類データを入力値として受け取るアクティビティで使用されます。重要: Intel Xe GPU を使用していて、タクソノミー マネージャーが正しく表示されない場合は、グラフィック ドライバーを最新バージョンに更新することをお勧めします。詳しくは、こちらのページをご覧ください。
タクソノミー拡張メソッド
Serialize()
DocumentTaxonomy
オブジェクトで呼び出されます。Serialize()
メソッドは、オブジェクトの JSON
表現を返します。これを格納しておけば、後で取得して使用できます。
Deserialize(String)
DocumentTaxonomy.Deserialize(jsonString)
スタティック拡張は、DocumentTaxonomy
オブジェクトを返します。このオブジェクトは、パラメーターとして渡された JSON エンコードデータでハイドレートされています。
GetFields(String)
DocumentTaxonomy
オブジェクトで呼び出されます。DocumentTypeId
文字列で呼び出された GetFields()
メソッドは、そのドキュメントの種類内で定義されたフィールドのリストを返します。
タクソノミー マネージャーを使用して、現在の自動化プロジェクト独自のタクソノミー ファイルを作成・編集できます。このタクソノミー ファイルにはユーザーが定義したドキュメントの種類が含まれ、それらはグループ別とカテゴリ別に整理されています。
[タクソノミーを読み込み] アクティビティを使ってタクソノミー ファイルを .NET データ型に変換して、次のアクティビティの入力値として渡すことで、このタクソノミー ファイルを使用できます。
タクソノミー マネージャーは、v1.6.0 またはそれ以降の UiPath.IntelligentOCR.Activities パッケージをプロジェクトの依存関係としてインストールした後でのみ使用できます。パッケージをインストールすると、[ウィザード] セクションのリボンに [タクソノミー マネージャー] ボタンが表示されます。
タクソノミー マネージャーを使用する
[タクソノミー マネージャー] ウィンドウでは、ドキュメントの種類を作成し、グルーブ別とカテゴリ別で整理することができます。プロジェクトでこのウィンドウを初めて開いたときには、グループ、カテゴリ、ドキュメントの種類のいずれも定義されていません。
構造を確立する
最初の手順として、グループまたはドキュメントの種類を作成します。これら 2 つの違いは、グループは階層構造になっており、ドキュメントの種類は単一のファイルとして作成できる点です。複雑なプロジェクトの場合はグループ、カテゴリ、ドキュメントの種類を作成する必要がありますが、簡易なプロジェクトで必要になるのは 1 つまたは 2 つのドキュメントの種類のみです。
グループを作成する
グループを作成したら、グループ内に作成するドキュメントの種類のカテゴリも必要になります。それには、[グループ] ボタンを使用します。グループの名前を選択したら、[保存] ボタンを使用するか、Enter キーを押して、これを保存します。
カテゴリを作成する
グループを定義して選択したら、定義済みのボタンを使用して、グループ内に [カテゴリ] または [ドキュメントの種類] (あるいはその両方) を作成できます。
ドキュメントの種類を作成する
ドキュメントの種類は、グループの一部または 1 つのドキュメントとして作成できます。グループ内に作成した場合は、グループが選択されていることを確認して、[ドキュメントの種類] ボタンをクリックします。
ドキュメントの種類を 1 つのファイルとして作成する場合は、グループが選択されていないことを確認して、[ドキュメントの種類] ボタンをクリックします。[ドキュメントの種類] ボタンをクリックしたら、ファイルの名前を入力して [保存] ボタンをクリックします。
既に作成済みのドキュメントの種類を選択して、名前を変更したり、一意の ID をクリップボードにコピーしたり、それを別のグループまたはカテゴリに再割り当てしたりする (またはどこにも割り当てない) ことができます。ドキュメントの種類のコードを入力することもできます。
ドキュメントの種類を保存すると、[ドキュメントの種類の ID] が生成されます。編集のためにドキュメントを開くと、[ドキュメントの種類名] タブの横にこの ID が表示されます。[ドキュメントの種類の ID] は種類が Group.Category.Document
の構造をしており、クリップボードにコピーできます。 [ドキュメントの種類の ID] コードは任意の機能であり、この機能を使用してドキュメントを検索したり、ドキュメントを分類データで定義するドキュメントの種類にマップできます。
フィールドを作成する
[ドキュメントの種類] を選択すると、[フィールド] ボタンを使用して新しいフィールドを作成できるようになります。[フィールド] ボタンをクリックしたら、名前を入力し、ドロップダウン リストから種類を選択できます。
[フィールド] カテゴリには、[詳細] と [ルール] の 2 つのタブがあります。[詳細] タブには、選択したフィールドに関する情報としてフィールド名、割り当てられたホットキー、フィールドの種類などが表示されます。[ルール] タブでは、フィールドの抽出結果が満たす必要があるルールを作成できます。
使用可能なフィールドの種類は次のとおりです。
- テキスト
- Number
- Date - この種類を選択すると、想定する形式も選択できます (任意)。
注:
予想される形式を追加する場合は、MSDN 準拠の形式を使用してください。
これは抽出器が使用可能な形式であり、[データ抽出スコープ] アクティビティが日付を解析して、日、月、年の各構成要素への分解を試みるときに使用されます。
- 名前
- アドレス
- Set - この種類を選択すると、事前設定されたリストからこのフィールドに複数の値を追加できます。
- Boolean
- Table - この種類を選択すると、表の構造を編集できます。列を追加して、列の名前や種類を編集できます。
詳細タブ
新しいフィールドが作成されたら、クリックして詳細を表示します。既定では、フィールドを開くと [詳細] タブが表示され、フィールドの名前、色、またはホットキーを変更できます。また、フィールドに複数の値が含まれているかどうか ([複数値である]) や、ドキュメント内に証拠のない値の処理を許可するかどうか ([参照が必要]) も指定できます。複数値オプションを使用すると、特定の値のリストに限定されることなく、複数の値をフィールドに含めることができます。
- 複数値である: フィールドが複数値として設定されている場合、その特定のフィールドに対して複数の値を報告できます。 例: エントリ数は可変の「取締役のリスト」を抽出するとします。 単一列のテーブルのような複数値フィールドを想像してみてください。
- 参照が必要: フィールドに参照が必要な場合、検証ステーションに表示されているドキュメントから選択しない限り、フィールドに値を追加できません。 特殊なフィールドにおいて、ドキュメントに表示されない可能性がある値をキャプチャする場合は、[参照が必要] をオフに切り替えることができます。 その効果として、ユーザーがその値の取得元であるドキュメント内の場所を指定せずに値を追加できるようになります。
作成したフィールドは、フィールドの横にある削除ボタンを使用して削除したり、ドラッグ アンド ドロップ機能を使用して並べ替えたりすることができます。
フィールドは [詳細] タブの [削除] ボタンを選択して削除することもできます。
この手順を繰り返すことにより、複数のグループ、カテゴリ、ドキュメントの種類を作成できます。これらは、[検索] フィールドを使用することでフィルター処理できます。
ルール タブ
フィールド ルールは、抽出結果を最適化しワークフロー実行時に自動的に検証するのに役立ちます。抽出を効率よく行い、検証ステーションで必要なフィールドを強調表示して人間が簡単に検証できるようにする役割があります。1 つのフィールドにつき複数のルールを作成して適用できます。
ルールを定義するには、[エバリュエーターの種類] と [重要度レベル] を設定します。
エバリュエーターの種類
エバリュエーターの種類を選択して、定義したルールの評価方法を指定します。AND または OR の 2 種類から選択できます。
エバリュエーターの種類 |
説明 |
例 |
---|---|---|
AND |
すべてのルールを実行する必要がある場合は、このエバリュエーターの種類を使用します。 |
ルール: 請求書番号は A で始まり X で終わる
|
OR |
実行するルールが 1 つだけの場合は、このエバリュエーターの種類を使用します。 |
ルール: 請求書番号は A または 123 で始まる
|
重要度レベル
フィールドに定義されたすべてのルールの重要度を示します。検証ステーション セッションでルールが満たされていない場合は、MUST レベルを設定することはできません。重要度レベルは MUST または SHOULD の 2 種類から選択できます。
作成したルールは、設定した重要度レベルが識別されるとトリガーされます。
ルールを送信する際、MUST レベルのルールは 100% 満たされている必要があります。満たされていない場合、送信操作は失敗します。SHOULD レベルのルールの場合は、ルールが満たされていなくても送信できます。
ルールが満たされているかどうかは、UiPath.DocumentProcessing.Contracts アクティビティ パッケージ内の ExtractionResult Class クラスのヘルパー メソッドを使用して確認できます。
重要度レベル |
説明 |
---|---|
MUST |
作成したルールが抽出結果プロセスに必ず含まれていなければならない場合は、この重要度レベルを使用します。 |
SHOULD |
作成したルールが任意の場合は、この重要度レベルを使用します。 |
[エバリュエーターの種類] と [重要度レベル] を選択したら、新たに作成したルールの種類を設定する必要があります。選択できるオプションは複数あります。以下に、利用可能なすべてのオプションのリストを示します。
- 空でない
- 予想される値
- 次で始まる
- 次で終わる
- 次の値を含む
- 固定長
- メール アドレス
- 正規表現
注: ルールを作成したフィールドの種類によって、選択できるルールの種類の数が決定されます。たとえば、Text フィールドの場合はすべてのルールの種類が表示されますが、Date フィールドの場合は [空でない] と [予想される値] の 2 種類しか表示されません。
ルールの種類
ルールの種類 | 説明 | フィールドの種類 | 重要度レベル | エバリュエーターの種類 |
---|---|---|---|---|
空でない | 抽出された値は空にすることはできません。つまり、フィールドは必須です。 値が見つからない場合は、検証/手動の入力が必要です。 | 種類が以下のフィールドに適用されます。
|
MUST SHOULD |
AND
OR |
予想される値 | ユーザーはすべての可能な値を定義し、抽出されたデータは、ルールの作成時に入力として追加された値の 1 つです (例: 雇用主の場合は「フルタイム」「パートタイム」「インターンシップ」のいずれかです。 | 種類が以下のフィールドに適用されます。
|
MUST SHOULD |
AND
OR |
式 | データを抽出するルールとして機能する数式を定義します。 | 種類が以下のフィールドに適用されます。
ルールの設定時に条件が必要です。 次のいずれかのオプションを選択します。
数式が必要です。 定義済みの演算子を使用して、式を定義します。 以下に、その例を示します。
|
MUST SHOULD |
AND
OR |
次で始まる | これは固定のルールです。つまり、抽出された値は、ユーザーが追加した値のいずれかから開始する必要があります。 | 種類が以下のフィールドに適用されます。
|
MUST SHOULD |
AND
OR |
次で終わる | これは固定のルールです。つまり、抽出された値は、ユーザーが追加した値のいずれかから開始する必要があります。 | 種類が以下のフィールドに適用されます。
|
MUST SHOULD |
AND
OR |
次の値を含む | これは固定のルールです。つまり、抽出された値は、ユーザーが追加した値のいずれかから開始する必要があります。 | 種類が以下のフィールドに適用されます。
|
MUST SHOULD |
AND
OR |
固定長 | これは固定のルールです。つまり、抽出された値は、ユーザーが追加した値のいずれかから開始する必要があります。 | 種類が以下のフィールドに適用されます。
|
MUST SHOULD |
AND
OR |
メール アドレス | これは固定のルールです。つまり、抽出された値は、ユーザーが追加した値のいずれかから開始する必要があります。 | 種類が以下のフィールドに適用されます。
|
MUST SHOULD |
AND
OR |
正規表現 | これは固定のルールです。つまり、抽出された値は、ユーザーが追加した値のいずれかから開始する必要があります。 | 種類が以下のフィールドに適用されます。
|
MUST SHOULD |
AND
OR |
ルールを使用する
実際の例を見ながら、ルールの適用性について理解を深めましょう。フィールドのルールを作成する方法は次のとおりです。
その他のオプション
編集中
作成したグループ、カテゴリ、またはドキュメントの種類の名前を編集できます。それには、設定の 3 つのレベルのいずれかを選択し [名前] フィールドを編集します。
削除しています。
グループ、カテゴリ、ドキュメントの種類を削除することもできます。次の 2 つの利用可能なオプションがあります。
ボタンをクリックします。
- ウィンドウの右上側にある
[削除] ボタンをクリックします。
どちらの場合も、削除操作を確認するよう求めるポップアップが表示されます。上の GIF に示すように、[削除] をクリックして操作を承認します。
カスタマイズとアクセシビリティ
新しく作成したフィールドには、ホットキーと色が自動的に割り当てられます。これらを使用して、可視性を向上させ、分類データ間をすばやく移動できます。ホットキーまたは色コード フィールドをクリックして、フィールドをカスタマイズします。
色とホットキーでカスタマイズされたフィールドによって、フィールドを表示する際に割り当てられた色を使用するよう、および割り当てられたホットキーをフィールドに値を指定するためのショートカットとして使用するよう、検証ステーションとテンプレート マネージャーに指示できます。フィールドのショートカットを使用してフィールドに値を割り当てる方法の詳細については、こちらをご覧ください。
キーボード ショートカットを使用して、タクソノミー マネージャー内を移動できます。[キーボード ショートカットを切り替え] オプションを有効化すると、キーボード ショートカットを誤ってトリガーするのを避けることができます。1 回のクリックでノードを折りたたむこともできます。
使用可能なすべてのキーボード ショートカットをわかりやすく示します。
taxonomy.json
ファイルに自動的に保存されます。