- 概要
- モデルの構築
- モデルの検証
- モデルのデプロイ
- API
- よくある質問

非構造化ドキュメントと複雑なドキュメント ユーザー ガイド
このセクションでは、フィールド グループ、フィールド、およびフィールドの種類を管理する方法と、プロンプトの指示を追加する方法について説明します。
- [タクソノミーを管理] ページ
- [予測を検証] ページのアノテーション ペイン
[タクソノミーを管理] から変更する場合
フィールド グループは、インラインの表で直接管理します。これにより、複数の項目を作成、編集、移動、または削除してから編集内容を保存できます。すべての変更は、変更を保存する際に同時に適用され、個々の変更ごとに新しいバージョンが生成されるのではなく、単一のプロジェクト バージョンの更新として保存されます。
フィールド グループを作成および設定する
[タクソノミーを管理] ページでフィールド グループを作成および設定するには、以下の手順を実行します。
- [フィールドとフィールド グループ] タブで、[抽出に関する全体的な指示] フィールドに指示を入力します。
注: プロジェクト レベルの指示には、業界やドキュメントの種類についての説明、ドキュメント固有の考慮事項 (1 つのファイル内にドキュメントが複数回出現するなど) を含めることができます。
- フィールド グループを選択し、インラインの表の以下の必須フィールドに入力します。
注: フィールド グループを作成した後でのみ、個々のフィールドをそのそれぞれのフィールド グループ内に追加できます。
- 名前 - 自然言語を使用してフィールド グループに名前を付けます。
- 指示 - 自然言語を使用してフィールド グループの説明を入力します。
- 新しいフィールド グループで、[追加] を選択して、新しいフィールドまたは新しいフィールド グループを追加します。[新しいフィールド グループ] オプションを使用すると、作成した親フィールド グループの下に子フィールド グループが作成されます。
注: 新しいフィールドの追加について詳しくは、「フィールドを作成および設定する」をご覧ください。フィールド グループ間の階層を定義するには、親フィールド グループを作成してから、その中に 1 つ以上の子フィールド グループを追加します。この構造により、フィールド グループ間の関係が確立されます。つまり、親フィールド グループに対して予測が返されない場合は、子フィールド グループも予測を返しません。親フィールド グループは実質的に主要な分類として機能し、その子は追加の詳細レベルを提供します。注: 親フィールド グループに対する指示は、子フィールド グループには影響しません。
- 変更がすべて完了したら、[保存] を選択します。変更が保存されて一括で適用されます。
アノテーション プロセス中にいつでも、[予測を検証] ページから直接、追加のフィールド グループ、フィールド、フィールドの種類を追加および設定できます。
フィールド グループとその階層の例
次の例は、フィールド グループとその階層を示しています。
- 請求書
- 請求番号
- 請求書 > 明細項目
- 単価
- 数量
- 明細行の金額
フィールド グループを編集する
フィールド グループは、次の手順に従ってインラインの表で直接編集できます。
- [タクソノミーを管理] ページの [フィールドとフィールド グループ] タブで、フィールド グループの名前または指示を選択します。
- 変更を行います。
- [保存] を選択します。
フィールド グループを移動する
- [タクソノミーを管理] ページの [フィールドとフィールド グループ] タブで、移動するフィールド グループの省略記号ボタンを選択します。
- [移動] を選択します。
- 表示される [Move field group] ウィンドウで、ドロップダウン リストを選択します。
- フィールド グループの新しい親を選択します。
注: 大なり記号
>は、フィールド グループの階層を定義するために使用されます。この記号は、親フィールド グループと子フィールド グループとの間の関係を設定します。 - フィールド グループが子である場合は、代わりにドロップダウン リストから [なし] を選択してそのフィールド グループを親フィールド グループにすることもできます。
- [Move field group] を選択します。
- [保存] を選択します。
フィールド グループを削除する
フィールド グループを削除するには、以下の手順を実行します。
- [タクソノミーを管理] ページの [フィールドとフィールド グループ] タブで、削除するフィールド グループの省略記号ボタンを選択します。
- [削除] を選択します。
- 表示される [削除を確定] ウィンドウで、[削除] を選択します。
重要: フィールド グループを削除すると、そのフィールド グループのアノテーションが失われます。この操作を元に戻す方法は、以前にパブリッシュ済みのモデル バージョンに戻す以外にありません。大幅な変更を行う前に、最新のモデル バージョンをパブリッシュしてください。
アノテーション ペインから変更する場合
フィールド グループを作成および設定する
[予測を検証] ページのアノテーション ペインからフィールド グループを作成および設定するには、以下の手順を実行します。
- アノテーション ペインで、[フィールド グループを追加] を選択します。
- [新しいフィールド グループ] を選択します。
- [フィールド グループを追加] サイド パネルで、以下のフィールドに入力します。
- フィールド グループ名 - 自然言語を使用してフィールド グループに名前を付けます。
- 指示 - 自然言語を使用してフィールド グループの説明を入力します。
- [追加] を選択します。
- [フィールド グループを編集] サイド パネルで、作成したフィールド グループを編集したり、[新しいフィールド] ボタンを使用して新しいフィールドを追加したりできます。
フィールド グループを編集する
フィールド グループを編集するには、以下の手順を実行します。
- アノテーション ペインで、フィールド グループにカーソルを合わせ、省略記号ボタンを選択します。
- [フィールド グループを編集] を選択します。
- 表示されるサイド パネルの [フィールド グループの詳細] で、指示を編集したり、フィールドを編集および削除したりできます。
- 変更が完了したら、[保存] を選択します。
フィールド グループを無視する
モデルでフィールド グループを除外する場合は、以下の手順を実行します。
- アノテーション ペインで、フィールド グループにカーソルを合わせ、省略記号ボタンを選択します。
- [Dismiss field group] を選択します。この操作を行うと、フィールド グループに打ち消し線が表示されます。
- 変更を元に戻すには、同じフィールド グループの省略記号から [Revert field group dismissal] を選択します。
- [タクソノミーを管理] ページ
- [予測を検証] ページのアノテーション ペイン
[タクソノミーを管理] から変更する場合
フィールドは、インラインの表で直接管理します。これにより、複数の項目を作成、編集、移動、または削除してから編集内容を保存できます。すべての変更は同時に適用され、個々の変更ごとに新しいバージョンが生成されるのではなく、単一のプロジェクト バージョンの更新として保存されます。
フィールドを作成および設定する
[タクソノミーを管理] ページでフィールドを作成および設定するには、以下の手順を実行します。
- [フィールドとフィールド グループ] タブで、フィールドを追加するフィールド グループを展開します。
- [追加] を選択します。
- [新しいフィールド] を選択して、個々のフィールドを作成します。
- インラインの表で、必要な詳細情報を以下のように入力して設定します。
- 名前 - フィールドに、そのフィールドが表すデータを正確に表す名前を付けます。
- 指示 - フィールドに関連する詳細な説明を入力し、必要なコンテキストを抽出に対して提供します。
- フィールドの種類 - 各フィールドにはフィールドの種類が割り当てられている必要があります。フィールドの種類は、事前設定済みのフィールドの種類またはカスタムのフィールドの種類のいずれかにすることができます。[フィールドの種類] ドロップダウン メニューを使用して、いずれかの事前設定済みオプション ([日付]、[正確なテキスト]、[推論されたテキスト]、[金額]、[数値]、[Boolean]) を選択します。
注:
- フィールドの種類は、異なるフィールドで再利用できます。これにより、指示を共有できます。
- フィールドの種類をフィールドの作成後に変更できます。ただし、フィールドの種類を変更すると、既存のアノテーションが失われます。
- テキストのフィールドの種類には、ドキュメントに存在していて抽出されたとおりの入力値 ([正確なテキスト]) を含めることができます。また、テキストに明確に記載されていない場合は、ドキュメントから推論された入力値を含めることもできます ([推論されたテキスト])。
カスタムのフィールドの種類を作成する場合は、ドロップダウン リストから [新しいフィールドの種類] オプションを選択します。詳しくは、「フィールドの種類を作成および設定する」をご覧ください。
- データ型 - このフィールドは、選択したフィールドの種類に応じて自動的に入力されます。
- [保存] を選択します。
フィールドの編集
フィールドは、次の手順に従ってインラインの表で直接編集できます。
- [タクソノミーを管理] ページの [フィールドとフィールド グループ] タブで、フィールドがあるフィールド グループを展開します。
- フィールド名、指示、またはフィールドの種類を選択します。
- 変更を行います。
- [保存] を選択します。
フィールドを移動する
- [タクソノミーを管理] ページの [フィールドとフィールド グループ] タブで、フィールドにカーソルを合わせます。
- ドラッグ ハンドルを使用して、フィールドが属するフィールド グループ内でフィールドを任意の場所に移動します。
- 新しい順序に問題がなければ、[保存] を選択します。
- 移動するフィールドの省略記号ボタンを選択します。
- [フィールドの定義をコピー] を選択します。フィールド全体とその詳細がコピーされます。
- 次に、コピーしたフィールドを貼り付けるフィールド グループを選択します。
- フィールド グループを選択したら、表示されるウィンドウで [貼り付け] を選択します。
また、すべてのフィールドをフィールド グループ間で移動する場合も、前述の手順と同じ手順に従います。ただし必ず、移動するフィールドがあるフィールド グループの省略記号ボタンを選択してください。
フィールドを削除する
フィールドを削除するには、以下の手順を実行します。
- [タクソノミーを管理] ページの [フィールドとフィールド グループ] タブで、削除するフィールドの省略記号ボタンを選択します。
- [削除] を選択します。
- 表示される [削除を確定] ウィンドウで、[削除] を選択します。
重要: フィールドを削除すると、そのフィールドのアノテーションが失われます。この操作を元に戻す方法は、以前にパブリッシュ済みのモデル バージョンに戻す以外にありません。大幅な変更を行う前に、最新のモデル バージョンをパブリッシュしてください。
アノテーション ペインから変更する場合
フィールドを作成および設定する
[予測を検証] ページのアノテーション ペインからフィールドを作成および設定するには、以下の手順を実行します。
- アノテーション ペインで、フィールド グループにカーソルを合わせ、省略記号ボタンを選択します。
- [フィールド グループを編集] を選択します。
- 表示されるサイド パネルで [新しいフィールド] を選択し、以下の必須のフィールドに入力します。
- 名前 - フィールドの名前を指定します。
- フィールドの種類 - ドロップダウン リストから、いずれかの事前設定済みオプション ([日付]、[正確なテキスト]、[推論されたテキスト]、[金額]、[数値]、[Boolean]) を選択します。
注:
- フィールドの種類は、異なるフィールドで再利用できます。これにより、指示を共有できます。
- フィールドの種類をフィールドの作成後に変更できます。ただし、フィールドの種類を変更すると、既存のアノテーションが失われます。
- テキストのフィールドの種類には、ドキュメントに存在していて抽出されたとおりの入力値 ([正確なテキスト]) を含めることができます。また、テキストに明確に記載されていない場合は、ドキュメントから推論された入力値を含めることもできます ([推論されたテキスト])。
カスタムのフィールドの種類を作成する場合は、ドロップダウン リストから [新しいフィールドの種類] オプションを選択します。詳しくは、「フィールドの種類を作成および設定する」をご覧ください。
- 指示 - ドキュメントから抽出する内容と、詳細の抽出方法を入力します。
- [保存] を選択します。
フィールドを削除する
- アノテーション ペインで、フィールド グループにカーソルを合わせ、省略記号ボタンを選択します。
- [フィールド グループを編集] を選択します。
- 表示されるサイド パネルで、削除するフィールドの省略記号を選択します。
- [削除] を選択します。
- 表示される [削除を確定] ウィンドウで、[削除] を選択します。
注: フィールドを削除すると、そのフィールドのトレーニング データが失われます。この操作を元に戻す方法は、以前のピン留めされたモデル バージョンに戻す以外にありません。大幅な変更を行う前に、最新のモデル バージョンをピン留めしてください。
フィールドの種類を作成および設定する
新しいフィールドの種類を作成および設定するには、以下の手順を実行します。
- [タクソノミーを管理] ページの [フィールドの種類] タブで [新しいフィールドの種類] を選択します。
- 必要なフィールドに入力します。
- 名前 - フィールドの種類の名前です。
- 指示 - データの書式設定方法に関する一般的な指示を含める必要があります。また、同じフィールドの種類を共有するすべてのフィールドに対してその指示を抽出する必要があります。
注:- フィールドの種類は、異なるフィールドで再利用できます。これにより、指示を共有できます。
- フィールドの種類の指示は、出力を特定の形式に正規化するための書式設定の指示として使用されます。たとえば、すべての日付を
YYYY-MM-DDとして抽出する場合に使用します。
- [データ型] ドロップダウン リストを使用して、次のいずれかの値を選択します。
- 文字列: 各種文字のほか、数字など、任意の文字を含めることができます。また、ドキュメントに明確に存在する入力値や、ドキュメントから推論された入力値を含めることもできます。たとえば、組織名、名、住所、電話番号などです。
- [入力値] で以下のいずれかを選択します。
- ドキュメント内に存在する必要がある: 値は、ドキュメント内に出現するとおりに正確に抽出されている必要があります。
- ドキュメントから推論: 抽出値はコンテキストから推論でき、ドキュメント内のテキストと完全に一致する必要はありません。
- [入力値] で以下のいずれかを選択します。
- 日付: さまざまな非構造化形式があり、UiPath の事前トレーニング済みの日付フィールドが使用されます。たとえば、開始日、有効期限などです。
- 数値: さまざまな非構造化形式があります。値は、UiPath の事前設定済みのフィールドの種類を使用して、標準化された形式に構造化されます。たとえば、項目数、変化率、小数値などです。
- 金額: さまざまな非構造化形式があり、UiPath の事前トレーニング済みの金額モデルが使用されます。たとえば、合計保険料、手数料などです。
- Boolean: ドキュメントから推論された True または False の値です。たとえば、既存の顧客には True を設定し、存在しない顧客には False を設定できます。
- チョイス: 一連の定義済みの値にマッピングされる、推論される値または正確な値です。以下に例を示します。
- 言語: 英語、ドイツ語、フランス語
- ドキュメントの種類: 水道料金の請求書、ガス料金の請求書、光熱費の請求書
- 商品カテゴリ: 投資口座、普通預金口座、当座預金口座
- 顧客の種類: ティア 1、ティア 2、ティア 3
データ型として [チョイス] を選択すると、次のオプションが表示されます。- 表示値
- 代替値
- チョイスを追加
値を入力したり、アノテーションを任意で行ったりできます。値は、可能な場合は指定した値のセットにマッピングされます。
重要: データ型を設定すると、変更することはできません。必ず正しいデータ型を選択してください。データ型が間違っていた場合は、フィールドの種類を削除し、正しいデータ型で再作成する必要があります。その理由は、データ型が異なる互換性のないフィールドの種類には、アノテーションを再マッピングできないためです。 - 文字列: 各種文字のほか、数字など、任意の文字を含めることができます。また、ドキュメントに明確に存在する入力値や、ドキュメントから推論された入力値を含めることもできます。たとえば、組織名、名、住所、電話番号などです。
- [保存] を選択します。
推論されるフィールドと正確なフィールドの例
推論されるフィールド
私は保険会社の引受業務チームで働いています。顧客に提供する所定の保険証券のカテゴリとして、自動車、住宅、健康、高級品など数百のカテゴリがあり、そのそれぞれがタイプ A、B、C のようにタイプ カテゴリに対応しています。
ドキュメントの内容に基づいて、処理が必要な保険証券のタイプ カテゴリを抽出して特定できるようにしたいと考えています。
この例では、メッセージのどこにも、この電子メールがタイプ E に関連することを明確に示す箇所がありません。そこで指示の中で、保険の種類ごとにコンテキストを提供し、モデルの予測に情報を提供します。たとえば、高級品に関連する請求はすべてタイプ E カテゴリに属します。
- ドキュメントのどこにも存在しないが、そのコンテキストから暗示される値
- ドキュメント内の複数の領域にわたり連結する必要がある値
- 複数の段落、行、または列にまたがる値
正確なフィールド
このリクエストを簡単に処理するには、既存の保険証券番号、名前、請求額が必要になると思われます。これらは、ドキュメント自体に明確に記載されており、抽出して下流工程に送る必要があることがわかっている値です。