- 概要
- Document Processing Contracts
- リリース ノート
- Document Processing Contracts について
- Box クラス
- IPersistedActivity インターフェイス
- PrettyBoxConverter クラス
- IClassifierActivity インターフェイス
- IClassifierCapabilitiesProvider インターフェイス
- ClassifierDocumentType クラス
- ClassifierResult クラス
- ClassifierCodeActivity クラス
- ClassifierNativeActivity クラス
- ClassifierAsyncCodeActivity クラス
- ClassifierDocumentTypeCapability クラス
- ExtractorAsyncCodeActivity クラス
- ExtractorCodeActivity クラス
- ExtractorDocumentType クラス
- ExtractorDocumentTypeCapabilities クラス
- ExtractorFieldCapability クラス
- ExtractorNativeActivity クラス
- ExtractorResult クラス
- ICapabilitiesProvider インターフェイス
- IExtractorActivity インターフェイス
- ExtractorPayload クラス
- DocumentActionPriority 列挙型
- DocumentActionData クラス
- DocumentActionStatus 列挙型
- DocumentActionType 列挙型
- DocumentClassificationActionData クラス
- DocumentValidationActionData クラス
- UserData クラス
- Document クラス
- DocumentSplittingResult クラス
- DomExtensions クラス
- Page クラス
- PageSection クラス
- Polygon クラス
- PolygonConverter クラス
- Metadata クラス
- WordGroup クラス
- Word クラス
- ProcessingSource 列挙型
- ResultsTableCell クラス
- ResultsTableValue クラス
- ResultsTableColumnInfo クラス
- ResultsTable クラス
- Rotation 列挙型
- SectionType 列挙型
- WordGroupType 列挙型
- IDocumentTextProjection インターフェイス
- ClassificationResult クラス
- ExtractionResult クラス
- ResultsDocument クラス
- ResultsDocumentBounds クラス
- ResultsDataPoint クラス
- ResultsValue クラス
- ResultsContentReference クラス
- ResultsValueTokens クラス
- ResultsDerivedField クラス
- ResultsDataSource 列挙型
- ResultConstants クラス
- SimpleFieldValue クラス
- TableFieldValue クラス
- DocumentGroup クラス
- DocumentTaxonomy クラス
- DocumentType クラス
- Field クラス
- FieldType 列挙型
- LanguageInfo クラス
- MetadataEntry クラス
- TextType 列挙型
- TypeField クラス
- ITrackingActivity インターフェイス
- ITrainableActivity インターフェイス
- ITrainableClassifierActivity インターフェイス
- ITrainableExtractorActivity インターフェイス
- TrainableClassifierAsyncCodeActivity クラス
- TrainableClassifierCodeActivity クラス
- TrainableClassifierNativeActivity クラス
- TrainableExtractorAsyncCodeActivity クラス
- TrainableExtractorCodeActivity クラス
- TrainableExtractorNativeActivity クラス
- Document Understanding Digitizer
- Document Understanding ML
- Document Understanding OCR ローカル サーバー
- Document Understanding
- IntelligentOCR
- リリース ノート
- IntelligentOCR アクティビティ パッケージについて
- プロジェクトの対応 OS
- 認証を構成する
- タクソノミーを読み込み
- ドキュメントをデジタル化
- ドキュメント分類スコープ
- キーワード ベースの分類器
- Document Understanding プロジェクト分類器
- インテリジェント キーワード分類器
- ドキュメント分類アクションを作成
- ドキュメント分類アクション完了まで待機し再開
- 分類器トレーニング スコープ
- キーワード ベースの分類器トレーナー
- インテリジェント キーワード分類器トレーナー
- データ抽出スコープ
- Document Understanding プロジェクト抽出器
- 正規表現ベースの抽出器
- フォーム抽出器
- インテリジェント フォーム抽出器
- 検証ステーションを提示
- ドキュメント検証アクションを作成
- ドキュメント検証アクション完了まで待機し再開
- 抽出器トレーニング スコープ
- 抽出結果をエクスポート
- ML サービス
- OCR
- OCR Contracts
- リリース ノート
- OCR コントラクトについて
- プロジェクトの対応 OS
- IOCRActivity インターフェイス
- OCRAsyncCodeActivity クラス
- OCRCodeActivity クラス
- OCRNativeActivity クラス
- Character クラス
- OCRResult クラス
- Word クラス
- FontStyles 列挙型
- OCRRotation 列挙型
- OCRCapabilities クラス
- OCRScrapeBase クラス
- OCRScrapeFactory クラス
- ScrapeControlBase クラス
- ScrapeEngineUsages 列挙型
- ScrapeEngineBase
- ScrapeEngineFactory クラス
- ScrapeEngineProvider クラス
- OmniPage
- PDF
- [リストから削除済] ABBYY
- [リストから削除済] ABBYY Embedded
Document Understanding アクティビティ
タクソノミーを読み込み
UiPath.IntelligentOCR.Activities.TaxonomyManagement.LoadTaxonomy
taxonomy.json
ファイルを変数に変換して、他のアクティビティでも再利用できるようにします。
共通
- 表示名 - アクティビティの表示名です。
その他
- プライベート - オンにした場合、変数および引数の値が Verbose レベルでログに出力されなくなります。
出力
-
分類データ - 読み込む分類データです。
DocumentTaxonomy
変数に格納されます。この出力結果は後ほど、分類データを入力値として受け取るアクティビティで使用されます。重要: Intel Xe GPU を使用していて、タクソノミー マネージャーが正しく表示されない場合は、グラフィック ドライバーを最新バージョンに更新することをお勧めします。詳しくは、こちらのページをご覧ください。
Serialize()
:DocumentTaxonomy
オブジェクトで呼び出されます。Serialize()
メソッドは、オブジェクトのJSON
表現を返します。これを格納しておけば、後で取得して使用できます。Deserialize(String)
:DocumentTaxonomy.Deserialize(jsonString)
静的拡張メソッドは、DocumentTaxonomy
オブジェクトを返します。このオブジェクトは、パラメーターとして渡された JSON エンコードデータでハイドレートされます。GetFields(String)
:DocumentTaxonomy
オブジェクトで呼び出されます。DocumentTypeId
文字列で呼び出されたGetFields()
メソッドは、そのドキュメントの種類内で定義されたフィールドのリストを返します。
タクソノミー マネージャーを使用して、現在の自動化プロジェクト独自のタクソノミー ファイルを作成・編集できます。このタクソノミー ファイルにはユーザーが定義したドキュメントの種類が含まれ、それらはグループ別とカテゴリ別に整理されています。
[タクソノミーを読み込み] アクティビティを使ってタクソノミー ファイルを .NET データ型に変換して、次のアクティビティの入力値として渡すことで、このタクソノミー ファイルを使用できます。
タクソノミー マネージャーは、v1.6.0 またはそれ以降の UiPath.IntelligentOCR.Activities パッケージをプロジェクトの依存関係としてインストールした後でのみ使用できます。パッケージをインストールすると、[ウィザード] セクションのリボンに [タクソノミー マネージャー] ボタンが表示されます。
[タクソノミー マネージャー] ウィンドウでは、ドキュメントの種類を作成し、グルーブ別とカテゴリ別で整理することができます。プロジェクトでこのウィンドウを初めて開いたときには、グループ、カテゴリ、ドキュメントの種類のいずれも定義されていません。
最初の手順として、グループまたはドキュメントの種類を作成します。これら 2 つの違いは、グループは階層構造になっており、ドキュメントの種類は単一のファイルとして作成できる点です。複雑なプロジェクトの場合はグループ、カテゴリ、ドキュメントの種類を作成する必要がありますが、簡易なプロジェクトで必要になるのは 1 つまたは 2 つのドキュメントの種類のみです。
グループを作成する
グループを作成すると、グループ内に作成するドキュメントの種類のカテゴリも必要になります。それには、[グループ] ボタンを使用します。グループの名前を選択したら、[保存] ボタンを使用するか Enter キーを使用して保存できます。
カテゴリを作成する
グループを定義して選択したら、定義済みのボタンを使用して、グループ内に [カテゴリ] または [ドキュメントの種類] (あるいはその両方) を作成できます。[保存] を選択するか、Enter キーを使用して設定を保存します。
ドキュメントの種類を作成する
ドキュメントの種類は、グループの一部または 1 つのドキュメントとして作成できます。グループ内に作成した場合は、グループが選択されていることを確認して、[ドキュメントの種類] を選択します。
ドキュメントの種類を 1 つのファイルとして作成する場合は、グループが選択されていないことを確認して、[ドキュメントの種類] を選択します。[ドキュメントの種類] を選択したら、ファイルの名前を入力して [保存] ボタンを選択します。
既に作成済みのドキュメントの種類を選択して、名前を変更したり、一意の ID をクリップボードにコピーしたり、それを別のグループまたはカテゴリに再割り当てしたりする (またはどこにも割り当てない) ことができます。ドキュメントの種類のコードを入力することもできます。
Group.Category.Document
の構造をしており、クリップボードにコピーできます。 [ドキュメントの種類の ID] コードは任意の機能であり、この機能を使用してドキュメントを検索したり、ドキュメントを分類データで定義するドキュメントの種類にマップできます。
フィールドを作成する
[ドキュメントの種類] を選択すると、[フィールド] ボタンを使用して新しいフィールドを作成できるようになります。[フィールド] ボタンを選択したら、名前を入力し、ドロップダウン リストから種類を選択できます。
[フィールド] カテゴリには、[詳細] と [ルール] の 2 つのタブがあります。[詳細] タブには、選択したフィールドに関する情報としてフィールド名、割り当てられたホットキー、フィールドの種類などが表示されます。[ルール] タブでは、フィールドの抽出結果が満たす必要があるルールを作成できます。
利用可能なフィールドの種類は以下のとおりです。
- テキスト
- Number
- Date - この型を選択すると、期待される形式も指定できます (任意)。
注:
予想される形式を追加する場合は、MSDN (MicroSoft Developer Network) 準拠の形式を使用します。
これは抽出器が使用可能な形式であり、[データ抽出スコープ] アクティビティが日付を解析して、日、月、年の各構成要素への分解を試みるときに使用されます。
- 名前
- Address
- Set - この型を選択すると、事前設定されたリストからこのフィールドに複数の値を追加できます。
- Boolean
- Table - この型を選択すると、表の構造を編集できます。列を追加して、列の名前や種類を編集できます。
詳細タブ
新しいフィールドが作成されたら、選択して詳細を表示します。既定では、フィールドを開くと [詳細] タブが表示され、フィールドの名前、色、またはホットキーを変更できます。また、フィールドに複数の値が含まれているかどうか ([複数値である]) や、ドキュメント内に証拠のない値の処理を許可するかどうか ([参照が必要]) も指定できます。複数値オプションを使用すると、特定の値のリストに限定されることなく、複数の値をフィールドに含めることができます。
- 複数値である: フィールドが複数値として設定されている場合、その特定のフィールドに対して複数の値を報告できます。たとえば、エントリ数が可変の「取締役のリスト」を抽出するとします。単一列の表のような複数値フィールドを想像してみてください。
- 参照が必要: フィールドに参照が必要な場合、検証ステーションに表示されているドキュメントから選択しない限り、フィールドに値を追加できません。 特殊なフィールドにおいて、ドキュメントに表示されない可能性がある値をキャプチャする場合は、[参照が必要] をオフに切り替えることができます。 その効果として、ユーザーがその値の取得元であるドキュメント内の場所を指定せずに値を追加できるようになります。
また、ドロップダウン リストからフィールドの [種類] を選択するか、[既定値] を追加することもできます。ドキュメント内で特定されたフィールドに値がない場合に、[抽出結果] に入力される値を定義するには、[既定値] フィールドを使用します。
- 読み取り専用: 有効化すると、[抽出結果] フィールドに設定されている検証メモをメッセージとして、人間の検証者に検証ステーションで表示できます。無効化すると (既定のステート)、人間の検証者は検証ステーションでそのメモを編集して、意思決定に関する情報をロボットに伝えることができます。
- テキスト: テキスト を選択すると、検証者のコメントが検証ステーションにテキスト メッセージ (編集が有効化されている場合は編集可能なテキスト) として表示されます。 人間の検証者は、検証ステーションで最大 200 文字のメッセージを表示、編集、または追加できます。
- オプション: [オプション] を選択すると、一連のラジオ ボタンを設定できます。これらのボタンは人間の検証者に表示され、読み取り専用でない場合は検証ステーションで選択できます。最大 10 個のオプションを追加できます。
GetFieldValidatorNotes(<fieldId>)
」と「SetFieldValidatorNotes(<fieldId>, <validatorNote>)
」について詳しくは、UiPath.DocumentProcessing.Contracts セクションの「ExtractionResult クラス」をご覧ください。
作成したフィールドは、フィールドの横にある削除ボタンを使用して削除したり、ドラッグ アンド ドロップ機能を使用して並べ替えたりすることができます。
フィールドは [詳細] タブの [削除] を選択して削除することもできます。
この手順を繰り返すことにより、複数のグループ、カテゴリ、ドキュメントの種類を作成できます。これらは、[検索] フィールドを使用することでフィルター処理できます。
ルール タブ
フィールド ルールは、抽出結果を最適化しワークフロー実行時に自動的に検証するのに役立ちます。抽出を効率よく行い、検証ステーションで必要なフィールドを強調表示して人間が簡単に検証できるようにする役割があります。1 つのフィールドにつき複数のルールを作成して適用できます。
ルールを定義するには、[エバリュエーターの種類] と [重要度レベル] を設定します。
エバリュエーターの種類
エバリュエーターの種類を選択して、定義したルールの評価方法を指定します。AND または OR の 2 種類から選択できます。
エバリュエーターの種類 |
説明 |
例 |
---|---|---|
AND |
すべてのルールを実行する必要がある場合は、このエバリュエーターの種類を使用します。 |
ルール: 請求書番号は A で始まり X で終わる
|
OR |
実行するルールが 1 つだけの場合は、このエバリュエーターの種類を使用します。 |
ルール: 請求書番号は A または 123 で始まる
|
重要度レベル
フィールドに定義されたすべてのルールの重要度を示します。検証ステーション セッションでルールが満たされていない場合は、MUST レベルを設定することはできません。重要度レベルは MUST または SHOULD の 2 種類から選択できます。
作成したルールは、設定した重要度レベルが識別されるとトリガーされます。
ルールを送信する際、MUST レベルのルールは 100% 満たされている必要があります。満たされていない場合、送信操作は失敗します。SHOULD レベルのルールの場合は、ルールが満たされていなくても送信できます。
ルールが満たされているかどうかは、UiPath.DocumentProcessing.Contracts アクティビティ パッケージ内の ExtractionResult Class クラスのヘルパー メソッドを使用して確認できます。
説明 | |
---|---|
MUST |
作成したルールが抽出結果プロセスに必ず含まれていなければならない場合は、この重要度レベルを使用します。 |
SHOULD |
作成したルールが任意の場合は、この重要度レベルを使用します。 |
[エバリュエーターの種類] と [重要度レベル] を選択したら、新たに作成したルールの種類を設定する必要があります。選択できるオプションは複数あります。以下に、利用可能なすべてのオプションのリストを示します。
- 空でない
- 予想される値
- 次で始まる
- 次で終わる
- 次の値を含む
- 固定長
- メール アドレス
- 正規表現注: ルールを作成したフィールドの種類によって、選択できるルールの種類の数が決定されます。たとえば、Text フィールドの場合はすべてのルールの種類が表示されますが、Date フィールドの場合は [空でない] と [予想される値] の 2 種類しか表示されません。
ルールの種類
説明 | フィールドの種類 | 重要度レベル | エバリュエーターの種類 | |
---|---|---|---|---|
空でない | 抽出された値は空にすることはできません。つまり、フィールドは必須です。 値が見つからない場合は、検証/手動の入力が必要です。 | 以下の型のフィールドに適用できます。
|
MUST SHOULD | AND
OR |
予想される値 | 予想されるすべての値をユーザーが定義します。抽出されるデータはルールの作成時に入力として追加された値の 1 つです (たとえば、Employer Type (雇用主の種類) は「full-time (フルタイム)」、「part-time (パートタイム)」、「internship (インターンシップ)」のいずれかです)。 | 以下の型のフィールドに適用できます。
|
MUST SHOULD | AND
OR |
式 | データを抽出するルールとして機能する数式を定義します。 | number 型のフィールドに適用できます。
ルールの設定時に条件が必要です。 次のいずれかのオプションを選択します。
数式は必須です。定義済みの演算子を使用して式を定義します。以下の例をご覧ください。
|
MUST SHOULD | AND
OR |
次で始まる | これは固定のルールです。つまり、抽出された値は、ユーザーが追加した値のいずれかから開始する必要があります。 | 以下の型のフィールドに適用できます。
|
MUST SHOULD | AND
OR |
次で終わる | これは、抽出された値がユーザーによって追加された値のいずれかで終わる必要があることを意味する固定のルールです。 | 以下の型のフィールドに適用できます。
|
MUST SHOULD | AND
OR |
次の値を含む | これは、抽出された値がユーザーによって追加された値のいずれかを含む必要があることを意味する、固定のルールです。 | 以下の型のフィールドに適用できます。
|
MUST SHOULD | AND
OR |
固定長 | これは、抽出された値が特定の固定長である必要があることを意味する固定のルールです。 | 以下の型のフィールドに適用できます。
|
MUST SHOULD | AND
OR |
メール アドレス | これは、抽出された値がメール形式で記述されている必要があることを意味する固定のルールです。 | 以下の型のフィールドに適用できます。
|
MUST SHOULD | AND
OR |
正規表現 | これは、抽出された値がユーザーによって追加された値のいずれかに類似する正規表現を含む必要があることを意味する、固定のルールです。 | 以下の型のフィールドに適用できます。
|
MUST SHOULD | AND
OR |
ルールを使用する
- [タクソノミー] パネルでフィールドを選択します。
- [ルール] タブに移動します。
- [新規追加] を選択して、新しいルールを追加します。
- [種類] が [次の値を含む] で、[式] が
st, str, street
であるfull address
ルールを入力します。 - [エバリュエーターの種類] を選択します。
この例では、[OR] を選択します。
- [重要度レベル] を選択します。
この例では、[MUST (高)] を選択します。
- [新規追加] を選択します。
phone number
ルールを入力します。この場合、[種類] は [空でない] です。- [新規追加] を選択します。
- [種類] が [次の値を含む] で、[式] が
city, state
であるcity or state
ルールを入力します。
以下のアニメーション画像は、前述の手順を示しています。
その他のオプション
編集中
作成したグループ、カテゴリ、またはドキュメントの種類の名前を編集できます。それには、設定の 3 つのレベルのいずれかを選択し [名前] フィールドを編集します。
削除しています。
グループ、カテゴリ、ドキュメントの種類を削除することもできます。次の 2 つの利用可能なオプションがあります。
- 削除するオブジェクトの親要素で [削除] を選択します。
- 削除するオブジェクトを選択しながら、[削除] を選択します。
どちらの場合も、削除操作を確認するよう求めるポップアップが表示されます。[削除] を選択して操作を承認します。
カスタマイズとアクセシビリティ
新しく作成したフィールドには、ホットキーと色が自動的に割り当てられます。これらを使用して、可視性を向上させ、分類データ間をすばやく移動できます。ホットキーまたは色コード フィールドをクリックして、フィールドをカスタマイズします。
色とホットキーでカスタマイズされたフィールドによって、フィールドを表示する際に割り当てられた色を使用するよう、および割り当てられたホットキーをフィールドに値を指定するためのショートカットとして使用するよう、検証ステーションとテンプレート マネージャーに指示できます。フィールドのショートカットを使用してフィールドに値を割り当てる方法の詳細については、「検証ステーション」をご覧ください。
フィールドに色とホットキーを割り当てるには、フィールドを選択し、[色] フィールドで特定のカラー コードを選択してから、[ホットキー] メニューから特定のホットキーを選択します。
キーボード ショートカットを使用して、タクソノミー マネージャー内を移動できます。[使用可能なキーボード ショートカットを表示] を選択し、[キーボード ショートカットを有効化] オプションをアクティブにして、キーボード ショートカットが誤ってトリガーされないようにします。ノードは折りたたむこともできます。
taxonomy.json
ファイルに自動的に保存されます。