- 基本情報
- フレームワーク コンポーネント
- タクソノミーの概要
- タクソノミー マネージャー
- タクソノミー関連のアクティビティ
- AI Center での Document Understanding
- パイプライン
- ML パッケージ
- データ マネージャー (Data Manager)
- OCR サービス
- ライセンス
- 参照
Document Understanding ガイド
タクソノミー マネージャー
タクソノミー マネージャーを使用して、現在のオートメーション プロジェクト独自のタクソノミー ファイルを作成・編集できます。このタクソノミー ファイルにはユーザーが定義したドキュメントの種類が含まれ、それらはグループ別とカテゴリ別に並べ替えられています。
[タクソノミーを読み込み] アクティビティを使ってタクソノミー ファイルを .NET データ型に変換して、次のアクティビティの入力値として渡すことで、このタクソノミー ファイルを使用できます。
タクソノミー マネージャーは、v1.6.0 またはそれ以降の UiPath.IntelligentOCR.Activities パッケージをプロジェクトの依存関係としてインストールした後でのみ使用できます。パッケージをインストールすると、[ウィザード] セクションのリボンに [タクソノミー マネージャー] ボタンが表示されます。
[タクソノミー マネージャー] ウィンドウでは、ドキュメントの種類を作成し、グルーブ別とカテゴリ別で並べ替えることができます。プロジェクトでこのウィンドウを初めて開いたときには、グループ、カテゴリ、ドキュメントの種類のいずれも定義されていません。
最初の手順として、作成するドキュメントの種類のためのグループとカテゴリを作成します。これを行うには、[任意のグループ] ドロップダウンの横にある [グループを追加] ボタンを使用します。グループの名前を選択したら、[保存] ボタンを使用するか、Enter キーを押して、これを保存します。
グループを定義すると、[任意のカテゴリ] ドロップダウンの横に [カテゴリを追加] ボタンが表示されます。上記と同じ手順で、カテゴリを作成します。
作成したグループまたはカテゴリの名前を編集できます。これは、グループまたはカテゴリのいずれかを選択し Edit Group (グループの編集) ボタンをクリックすることで行うことができます。
グループとカテゴリも削除できます。これは、Remove Group (グループの削除) ボタンをクリックすることにより実行できます。削除アクションの確認を求めるポップアップが表示されます。Yes をクリックして、アクションを承認します。
グループとカテゴリを定義すると、ドキュメントの種類の作成に進むことができます。これを行うには、[新しいドキュメントの種類を追加] ボタンをクリックします。ドキュメントの種類を作成すると、[ドキュメントの種類の詳細] タブが表示されます。このタブでは、名前、グループ、カテゴリ、ドキュメントの種類コードを選択するだけでなく、ドキュメントの種類にフィールドを追加することもできます。
[新しいフィールド] ボタンをクリックすると、[フィールドを編集] タブが表示されます。このタブでは、フィールドの名前の選択、複数値かどうか ([複数値である])、またはドキュメント内に証拠のない値の処理を許可するかどうか ([参照が必要]) の指定、およびフィールドの種類の選択が可能です。
使用可能なフィールドの種類は次のとおりです。
- テキスト
- Number
- Date - この種類を選択すると、想定する形式も選択できます (任意)。
注:
予想される形式を追加する場合は、MSDN 準拠の形式を使用してください。
これは抽出器が使用可能な形式であり、アクティビティが日付を解析して、日、月、年の各構成要素への分解を試みるときに使用されます。
- 名前
- Address
- キーワード (Keyword)
- Set - この種類を選択すると、このフィールドに複数の値を追加できます。
- Boolean
- Table - この種類を選択すると、表の構造を編集できます。列を追加して、列の名前や種類を編集できます。
フィールドを希望どおりに設定したら、[保存] をクリックして [フィールドを編集] タブを閉じ、[ドキュメントの種類の詳細] タブにこのフィールドを追加します。この操作を複数回繰り返して、必要なフィールドを追加できます。
[ドキュメントの種類の詳細] タブで作成したフィールドをクリックすると、編集可能になります。また、これらのフィールドの削除や並べ替えは、フィールドをホバーすると横に表示されるボタンを使用します。
ドキュメントの種類の設定が完了したら、[保存] をクリックして [ドキュメントの種類の詳細] タブを閉じます。メイン タブに新規作成したドキュメントの種類が表示されます。
この手順を繰り返すことにより、複数のグループ、カテゴリ、ドキュメントの種類が作成できます。これらは、[名前で検索] フィールドを使用することで並べ替えができます。
Group.Category.Document
の構造を持っています。
taxonomy.json
ファイルに自動的に保存されます。ドキュメントの種類を作成したら、ウィザードを閉じます。これで、変更が保存されます。