UiPath Documentation
document-understanding
2024.10
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
UiPath logo, featuring letters U and I in white

Document Understanding ガイド

最終更新日時 2026年4月6日

フィールドを作成および設定する

Fields can be renamed. Just select the Edit field編集アイコン button and simply edit the name of the field at the top of the window.

後でフィールドを ML モデルのトレーニングに使用しないと決めた場合は、そのフィールドを削除するか、[フィールドを編集] ウィンドウの [非表示] チェックボックスをオンにしてそのフィールドを常に非表示にすることができます。

注:

作成できるフィールドは、最大 300 件です。

列フィールド

請求書ドキュメントの明細項目である説明または単価は、列フィールドの例となります。

新しい列フィールドを作成する

  • Selectプラス記号のアイコン in the table section at the top of the page to add a new Column field. The Create Column Field window is displayed.

  • [一意のフィールド名を入力] フィールドに、フィールドの一意の名前を入力します。このフィールドでは大文字は使用できません。小文字、数字、アンダースコア (_)、およびダッシュ (-) のみを含めることができます。

  • Select OK. The Edit Field window is displayed with the General tab open.

    新しい列フィールドを作成ウィザードの [全般] タブのスクリーンショット

  • [コンテンツの種類] ドロップダウン リストからコンテンツの種類を選択します。

  • Select the Hotkey field and press a key on your keyboard to automatically populate it.

  • Select the Split items checkbox if you want this field to be used as a delimiter between line items or rows in a table. Any line on which this field appears is considered to be a new line item or row in the table. Most commonly this is used on Line Amount fields on Invoice line items. Split Items are only available for FormsAI document type columns.

  • エクスポートされるデータセットにこのフィールドを含めたくない場合は、[非表示] チェックボックスをオンにします。

  • [詳細設定] タブを選択します。

  • [スコアリング] ドロップダウン リストから、モデル予測の評価を実行する際の精度の決定に使用する尺度を選択します。

  • [色] フィールドに、フィールドの目的の色の 16 進コードを入力します。

  • Select Save to save your settings.

列フィールドを編集する

Select the Edit field編集アイコン button. The available options for column fields can be found in the following table.

オプション

タブ

説明

フィールド名

なし

フィールドの一意の名前です。

The field does not accept uppercase letters. It can only contain lowercase letters, numbers, underscore _ and dash - .

コンテンツの種類

全般

フィールドのコンテンツの種類です。

  • string : appropriate for company names or addresses, as well as payment terms, or for any other field where the RPA developer prefers to build the parsing or formatting logic manually, in the RPA workflow.
  • number : appropriate for amounts or quantities, with intelligent parsing of the decimal/thousands separators.
  • date : the model parses, formats and unifies the output in a yyyy-mm-dd format. You can indicate how ambiguous dates should be parsed and returned. To do this, choose between Non-US style (yyyy-mm-dd) and US style (yyyy-dd-mm) from the Date format option.
  • phone : appropriate for phone numbers. Formatting removes letters and parentheses, and replaces spaces with dashes.
  • id-no : appropriate for alphanumeric codes, numbers of IDs, it is similar to the string content type, but includes cleaning of any characters coming before a colon : . If the id number you need to extract might contain colon : characters, please use string as content type instead to avoid data loss.

ショートカット

全般

フィールドのショートカット キーです。1 つまたは 2 つのキーを使用できます。

項目を分割

全般

このフィールドを明細項目や表の行の区切り文字として使用する場合は、このチェックボックスをオンにします。行にこのフィールドが表示されている場合は、新しい明細項目または表の行とみなされます。通常は、請求書の明細項目の「明細金額」フィールドで使用されます。

非表示

全般

エクスポートされるデータセットにこのフィールドが含まれないようにしたい場合は、このチェックボックスをオンにします。

Advanced (カスタム)

フィールドの色です (16 進数表記)。値が有効でない場合、新しい値が生成されます。

スコアリング

Advanced (カスタム)

モデルの予測の評価を実行するときの精度を決定するために使用する尺度です。コンテンツの種類が string の場合にのみ設定できます。他のすべてのコンテンツの種類では、完全一致のスコアリング方法が使用されます。オプション:

  • exact match : a prediction is only deemed to be correct (score of 1) if it exactly matches the true value. If it differs by even a single character, then it is deemed to be incorrect (score of 0).
  • levenshtein : a prediction is deemed to be partially correct according to the Levenshtein distance between the prediction and the true value. If a 10-letter value is predicted correctly, except for the last 2 characters, then the score of that prediction will be 0.8.

列フィールドを削除する

列フィールドを削除するには、次の手順を実行します。

  1. Select the Edit field編集アイコン button corresponding to the column field you want to delete.

  2. Select the Delete button.

  3. フィールドの正確な名前を入力します。

    列フィールドを削除するダイアログのスクリーンショット

  4. [OK] を選択します。

  5. 列フィールドと、関連付けられたラベル付けデータが削除されます。

標準フィールド

これらは、特定のドキュメントに 1 回だけ表示されるフィールドです。列フィールドの例としては、請求書ドキュメントの明細項目である請求書番号または合計金額があります。

新しい標準フィールドを作成

  • Selectプラス記号のアイコン on the right pane in the Regular Fields section. The Create Regular Field window is displayed.
  • [一意のフィールド名を入力] フィールドに、フィールドの一意の名前を入力します。このフィールドでは大文字は使用できません。小文字、数字、アンダースコア (_)、およびダッシュ (-) のみを含めることができます。
  • Select OK. The Edit Field window is displayed with the General tab open.
  • [コンテンツの種類] ドロップダウン リストからコンテンツの種類を選択します。
  • Select the Shortcut field and press a key on your keyboard to automatically populate it.
  • 確認対象のフィールドが、住所や説明のように、複数のテキスト行にまたがる可能性がある場合は、[複数行] チェック ボックスをオンにします。このオプションをオンにしない場合は、最初の行だけが返されます。
  • Select the Multi-value checkbox for all the values detected in the document to be displayed as a list. You can either select the multi-line or the Multi-value checkbox.
  • エクスポートされるデータセットにこのフィールドを含めたくない場合は、[非表示] チェックボックスをオンにします。
  • [詳細設定] タブを選択します。
  • 指定したページ上の単一のフィールドで、モデルが複数のインスタンスを予測する場合は、[後処理] ドロップダウン リストから後処理のメカニズムを選択します。
  • [スコアリング] ドロップダウン リストから、モデル予測の評価を実行する際の精度の決定に使用する尺度を選択します。
  • [色] フィールドに、目的のフィールド色の 16 進コードを入力します。
  • Select Save to save your settings.

標準フィールドを編集する

Select the Edit field編集アイコン button. The available options for regular fields can be found in the following table.

オプション

タブ

説明

フィールド名

なし

フィールドの一意の名前です。

The field does not accept uppercase letters. It can only contain lowercase letters, numbers, underscore _ and dash - .

コンテンツの種類

全般

フィールドのコンテンツの種類です。

  • string : appropriate for company names or addresses, as well as payment terms, or for any other field where the RPA developer prefers to build the parsing or formatting logic manually, in the RPA workflow.
  • number : appropriate for amounts or quantities, with intelligent parsing of the decimal/thousands separators.
  • date : the model parses, formats and unifies the output in a yyyy-mm-dd format. You can indicate how ambiguous dates should be parsed and returned. To do this, choose between Non-US style (yyyy-mm-dd) and US style (yyyy-dd-mm) from the Date format option. This option has no impact when the date is not ambiguous and is only supported by ML Packages version 22.10.2 or later.
  • phone : appropriate for phone numbers. Formatting removes letters and parentheses, and replaces spaces with dashes.
  • id-no : appropriate for alphanumeric codes, numbers of IDs, it is similar to the string content type, but includes cleaning of any characters coming before a colon : . If the id number you need to extract might contain colon : characters, please use string as content type instead to avoid data loss.

後処理

Advanced (カスタム)

後処理のメカニズムです。モデルは、指定したページでフィールドが複数箇所に出現すると予測した場合、以下の値を返します。

  • highest_confidence : the value with the highest confidence.
  • first_span : the first value.
  • largest_value : the largest numeric value. This is only displayed for number content type and is appropriate for Total Amount fields.
  • longest_value : the value consisting of the largest number of characters.

ショートカット

全般

フィールドのショートカット キーです。1 つまたは 2 つのキーを使用できます。

複数行

全般

複数のテキスト行にまたがる可能性があるフィールド (住所や説明) の場合に、このチェックボックスをオンにします。オンにしない場合は、最初の行だけが返されます。

複数値

全般 ドキュメントで検出されたすべての値のリストを取得するには、このチェックボックスをオンにします。[複数行] または [複数値] チェックボックスをオンにできます。

非表示

全般

エクスポートされるデータセットにこのフィールドが含まれないようにしたい場合は、このチェックボックスをオンにします。

スコアリング

Advanced (カスタム)

モデルの予測の評価を実行するときの精度を決定するために使用する尺度です。コンテンツの種類が string の場合にのみ設定できます。他のすべてのコンテンツの種類では、完全一致のスコアリング方法が使用されます。オプション:

  • exact match : a prediction is only deemed to be correct (score of 1) if it exactly matches the true value. If it differs by even a single character, then it is deemed to be incorrect (score of 0).
  • levenshtein : a prediction is deemed to be partially correct according to the Levenshtein distance between the prediction and the true value. If a 10-letter value is predicted correctly, except for the last 2 characters, then the score of that prediction will be 0.8.

Advanced (カスタム)

フィールドの色です (16 進数表記)。値が有効でない場合、新しい値が生成されます。

標準フィールドを削除する

標準フィールドを削除するには、次の手順を実行します。

  1. Select the Edit field編集アイコン button corresponding to the regular field you want to delete.

  2. Select the Delete button.

  3. フィールドの正確な名前を入力します。

    フィールドをスキーマから削除するかを確認するダイアログのスクリーンショット

  4. [OK] を選択します。

  5. 標準フィールドと、そのフィールドに関連づけられたラベル付けデータが削除されます。

分類フィールド

ドキュメント全体を参照するデータ ポイントです。たとえば、領収書の経費の種類 (飲食、宿泊、飛行機、輸送) または請求書の通貨 (米ドル、ユーロ、日本円) が分類フィールドの例となります。

新しい分類フィールドを作成

  1. Select プラス記号のアイコン on the right pane in the Classification Fields section. The Create a new classification field window is displayed.
  2. [一意のフィールド名を入力] フィールドに、フィールドの一意の名前を入力します。このフィールドでは大文字は使用できません。小文字、数字、アンダースコア (_)、およびダッシュ (-) のみを含めることができます。
  3. Select OK. The Edit Field window is displayed.
  4. テキスト領域にクラスのリストを入力し、名前をコンマ区切りのリストとして入力します。
  5. Select Save to save your settings.

分類フィールドを編集する

Select the Edit field編集アイコン button. Define a list of possible values. Commas must separate values. An optional description of the value may be included after colon : (option 1 : description 1).

分類フィールドを編集するインターフェイスのスクリーンショット

分類フィールドを削除する

分類フィールドを削除するには、次の手順を実行します。

  1. Select the Edit field編集アイコン button corresponding to the classification field you want to delete.

  2. Select the Delete button.

  3. フィールドの正確な名前を入力します。

    分類フィールドを削除するダイアログのスクリーンショット

  4. [OK] を選択します。

  5. 分類フィールドと、そのフィールドに関連付けられたラベル付けデータが削除されます。

このページは役に立ちましたか?

接続

ヘルプ リソース サポート

学習する UiPath アカデミー

質問する UiPath フォーラム

最新情報を取得