document-understanding
2024.10
true
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
UiPath logo, featuring letters U and I in white

Document Understanding ガイド

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
最終更新日時 2024年12月18日

フィールドを作成および設定する

フィールドの名前は変更できます。[フィールドを編集] ボタンをクリックして、ウィンドウ上部のフィールドの名前を編集するだけです。

後でフィールドを ML モデルのトレーニングに使用しないと決めた場合は、そのフィールドを削除するか、[フィールドを編集] ウィンドウの [非表示] チェックボックスをオンにしてそのフィールドを常に非表示にすることができます。

注: 作成できるフィールドは、最大 300 件です。

列フィールド

請求書ドキュメントの明細項目である説明または単価は、列フィールドの例となります。

新しい列フィールドを作成する

  • ページ上部の表セクションの docs image アイコンをクリックし、新しい列フィールドを追加します。[新しい列フィールドを作成] ウィンドウが表示されます。
  • [一意のフィールド名を入力] フィールドに、フィールドの一意の名前を入力します。このフィールドでは大文字は使用できません。小文字、数字、アンダースコア (_)、およびダッシュ (-) のみを含めることができます。
  • [OK] をクリックします。[フィールドを編集] ウィンドウが表示され、[全般] タブが開きます。

    docs image
  • [コンテンツの種類] ドロップダウン リストからコンテンツの種類を選択します。
  • [ホットキー] フィールドをクリックし、お使いのキーボードのキーを押すと、キーが自動的に設定されます。
  • このフィールドを明細項目や表の行の区切り文字として使用する場合は、[項目を分割] チェックボックスをオンに選択します。行にこのフィールドが表示されている場合は、新しい明細項目または表の行と見なされます。通常は、請求書の明細項目の「明細金額」フィールドで使用されます。

  • エクスポートされるデータセットにこのフィールドを含めたくない場合は、[非表示] チェックボックスをオンにします。
  • [詳細設定] タブをクリックします。
  • [スコアリング] ドロップダウン リストから、モデル予測の評価を実行する際の精度の決定に使用する尺度を選択します。
  • [色] フィールドに、フィールドの目的の色の 16 進コードを入力します。
  • [保存] をクリックして設定を保存します。

列フィールドを編集する

[フィールドを編集] ボタンをクリックします。列フィールドで利用可能なオプションは下表のとおりです。

オプション

タブ

説明

フィールド名

なし

フィールドの一意の名前です。

このフィールドでは大文字は使用できません。小文字、数字、アンダースコア (_)、およびダッシュ (-) のみを含めることができます。

コンテンツの種類

全般

フィールドのコンテンツの種類です。

  • 文字列: 会社名、住所、支払い条件、およびその他の RPA 開発者が RPA ワークフロー内に解析または書式設定ロジックを手動で構築するためのあらゆるフィールドに適しています。
  • 数値: 金額または数量に適しており、小数点/桁区切り文字をインテリジェントに解析します。
  • 日付: モデルによって、出力が yyyy-mm-dd 形式で解析、フォーマット、統合されます。 あいまいな日付の解析方法と戻り値の形式を指定できます。 このためには、[ 日付の形式] オプションから [ 米国以外の形式] (yyyy-mm-dd) または[米国の形式] (yyyy-dd-mm) を選択します。
  • 電話番号: 電話番号に適しています。書式を設定すると文字と括弧が削除され、スペースがダッシュに置き換えられます。
  • ID 番号: 英数字のコードや ID の数字に適しています。コンテンツの種類「string」に似ていますが、コロン (:) の前の文字をすべて削除します。抽出する ID 番号にコロン (:) が含まれる場合は、データの損失を避けるためコンテンツの種類として [文字列] を使用してください。

ショートカット

全般

フィールドのショートカット キーです。1 つまたは 2 つのキーを使用できます。

項目を分割

全般

このフィールドを明細項目や表の行の区切り文字として使用する場合は、このチェックボックスをオンにします。行にこのフィールドが表示されている場合は、新しい明細項目または表の行とみなされます。通常は、請求書の明細項目の「明細金額」フィールドで使用されます。

非表示

全般

エクスポートされるデータセットにこのフィールドが含まれないようにしたい場合は、このチェックボックスをオンにします。

Advanced (カスタム)

フィールドの色です (16 進数表記)。値が有効でない場合、新しい値が生成されます。

スコアリング

Advanced (カスタム)

モデルの予測の評価を実行するときの精度を決定するために使用する尺度です。コンテンツの種類が string の場合にのみ設定できます。他のすべてのコンテンツの種類では、完全一致のスコアリング方法が使用されます。オプション:

  • exact match: 予測は、真の値に完全に一致する場合にのみ正しい (スコア: 1) とみなされます。1 文字でも異なる場合は、正しくない (スコア: 0) とみなされます。
  • levenshtein – 予測は、予測と真の値の間のレーベンシュタイン距離に基づいて、部分的に正しいものとみなされます。10 文字の値が、最後の 2 文字を除き正しく予測される場合、この予測のスコアは 0.8 になります。

列フィールドを削除する

列フィールドを削除するには、次の手順を実行します。

  1. 削除する列フィールドに対応する [フィールドを編集] docs image ボタンをクリックします。
  2. [削除] ボタンをクリックします。
  3. フィールドの正確な名前を入力します。


  4. [OK] をクリックします。
  5. 列フィールドと、関連付けられたラベル付けデータが削除されます。

標準フィールド

これらは、特定のドキュメントに 1 回だけ表示されるフィールドです。列フィールドの例としては、請求書ドキュメントの明細項目である請求書番号または合計金額があります。

新しい標準フィールドを作成

  • [標準フィールド] セクションの右側のペインで docs image アイコンをクリックします。[新しい標準フィールドを作成] ウィンドウが表示されます。
  • [一意のフィールド名を入力] フィールドに、フィールドの一意の名前を入力します。このフィールドでは大文字は使用できません。小文字、数字、アンダースコア (_)、およびダッシュ (-) のみを含めることができます。
  • [OK] をクリックします。[フィールドを編集] ウィンドウが表示され、[全般] タブが開きます。
  • [コンテンツの種類] ドロップダウン リストからコンテンツの種類を選択します。
  • [ショートカット] フィールドをクリックしてお使いのキーボードのキーを押すと、キーが自動的に設定されます。
  • 確認対象のフィールドが、住所や説明のように、複数のテキスト行にまたがる可能性がある場合は、[複数行] チェック ボックスをオンにします。このオプションをオンにしない場合は、最初の行だけが返されます。
  • ドキュメントで検出されたすべての値のリストを取得するには、この [複数値] チェックボックスをオンにします。[複数行] または [複数値] チェックボックスをオンにできます。
  • エクスポートされるデータセットにこのフィールドを含めたくない場合は、[非表示] チェックボックスをオンにします。
  • [詳細設定] タブをクリックします。
  • 指定したページ上の単一のフィールドで、モデルが複数のインスタンスを予測する場合は、[後処理] ドロップダウン リストから後処理のメカニズムを選択します。
  • [スコアリング] ドロップダウン リストから、モデル予測の評価を実行する際の精度の決定に使用する尺度を選択します。
  • [色] フィールドに、目的のフィールド色の 16 進コードを入力します。
  • [保存] をクリックして設定を保存します。

標準フィールドを編集する

[フィールドを編集] ボタンをクリックします。標準フィールドで利用可能なオプションは下表のとおりです。

オプション

タブ

説明

フィールド名

なし

フィールドの一意の名前です。

このフィールドでは大文字は使用できません。小文字、数字、アンダースコア (_)、およびダッシュ (-) のみを含めることができます。

コンテンツの種類

全般

フィールドのコンテンツの種類です。

  • 文字列: 会社名、住所、支払い条件、およびその他の RPA 開発者が RPA ワークフロー内に解析または書式設定ロジックを手動で構築するためのあらゆるフィールドに適しています。
  • 数値: 金額または数量に適しており、小数点/桁区切り文字をインテリジェントに解析します。
  • 日付: モデルによって、出力が yyyy-mm-dd 形式で解析、フォーマット、統合されます。 あいまいな日付の解析方法と戻り値の形式を指定できます。 このためには、[ 日付の形式] オプションから [ 米国以外の形式] (yyyy-mm-dd) または[米国の形式] (yyyy-dd-mm) を選択します。日付があいまいではない場合は、このオプションに効果はありません。このオプションは v22.10.2 以降の ML パッケージでのみサポートされます。
  • 電話番号: 電話番号に適しています。書式を設定すると文字と括弧が削除され、スペースがダッシュに置き換えられます。
  • ID 番号: 英数字のコードや ID の数字に適しています。コンテンツの種類「string」に似ていますが、コロン (:) の前の文字をすべて削除します。抽出する ID 番号にコロン (:) が含まれる場合は、データの損失を避けるためコンテンツの種類として [文字列] を使用してください。

後処理

Advanced (カスタム)

後処理のメカニズムです。モデルは、指定したページでフィールドが複数箇所に出現すると予測した場合、以下の値を返します。

  • highest_confidence: 最も信頼度の高い値。
  • first_span: 最初の値。
  • largest_value: 最も大きい数値。コンテンツの種類が number の場合にのみ表示され、[合計金額] フィールドに適しています。
  • longest_value: 最大数の文字から成る値。

ショートカット

全般

フィールドのショートカット キーです。1 つまたは 2 つのキーを使用できます。

複数行

全般

複数のテキスト行にまたがる可能性があるフィールド (住所や説明) の場合に、このチェックボックスをオンにします。オンにしない場合は、最初の行だけが返されます。

複数値

全般ドキュメントで検出されたすべての値のリストを取得するには、このチェックボックスをオンにします。[複数行] または [複数値] チェックボックスをオンにできます。

非表示

全般

エクスポートされるデータセットにこのフィールドが含まれないようにしたい場合は、このチェックボックスをオンにします。

スコアリング

Advanced (カスタム)

モデルの予測の評価を実行するときの精度を決定するために使用する尺度です。コンテンツの種類が string の場合にのみ設定できます。他のすべてのコンテンツの種類では、完全一致のスコアリング方法が使用されます。オプション:

  • exact match: 予測は、真の値に完全に一致する場合にのみ正しい (スコア: 1) とみなされます。1 文字でも異なる場合は、正しくない (スコア: 0) とみなされます。
  • levenshtein – 予測は、予測と真の値の間のレーベンシュタイン距離に基づいて、部分的に正しいものとみなされます。10 文字の値が、最後の 2 文字を除き正しく予測される場合、この予測のスコアは 0.8 になります。

Advanced (カスタム)

フィールドの色です (16 進数表記)。値が有効でない場合、新しい値が生成されます。

標準フィールドを削除する

標準フィールドを削除するには、次の手順を実行します。

  1. 削除する標準フィールドに対応する [フィールドを編集] docs image ボタンをクリックします。
  2. [削除] ボタンをクリックします。
  3. フィールドの正確な名前を入力します。


  4. [OK] をクリックします。
  5. 標準フィールドと、そのフィールドに関連づけられたラベル付けデータが削除されます。

分類フィールド

ドキュメント全体を参照するデータ ポイントです。たとえば、領収書の経費の種類 (飲食、宿泊、飛行機、輸送) または請求書の通貨 (米ドル、ユーロ、日本円) が分類フィールドの例となります。

新しい分類フィールドを作成

  1. [分類フィールド] セクションの右側のペインで docs image アイコンをクリックします。[新しい分類フィールドを作成] ウィンドウが表示されます。
  2. [一意のフィールド名を入力] フィールドに、フィールドの一意の名前を入力します。このフィールドでは大文字は使用できません。小文字、数字、アンダースコア (_)、およびダッシュ (-) のみを含めることができます。
  3. [OK] をクリックします。[フィールドを編集] ウィンドウが表示されます。
  4. テキスト領域にクラスのリストを入力し、名前をコンマ区切りのリストとして入力します。
  5. [保存] をクリックして設定を保存します。

分類フィールドを編集する

[フィールドを編集] docs image ボタンをクリックします。可能な値のリストを定義します。値を区切るには、コンマを使用します。任意で、値の説明をコロン (:) の後に入力できます (オプション 1: 説明 1)。


分類フィールドを削除する

分類フィールドを削除するには、次の手順を実行します。

  1. 削除する分類フィールドに対応する [フィールドを編集] docs image ボタンをクリックします。
  2. [削除] ボタンをクリックします。
  3. フィールドの正確な名前を入力します。


  4. [OK] をクリックします。
  5. 分類フィールドと、そのフィールドに関連付けられたラベル付けデータが削除されます。

このページは役に立ちましたか?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
Uipath Logo White
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.