- 基本情報
- フレームワーク コンポーネント
- ML パッケージ
- パイプライン
- データ マネージャー (Data Manager)
- OCR サービス
- Automation Suite にデプロイされた Document Understanding
- AI Center スタンドアロンにデプロイされた Document Understanding
- ディープ ラーニング
- ライセンス
- 参照
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Document Understanding ガイド
フィールドを作成および設定する
フィールドの名前は変更できません。したがって、フィールドに名前を付ける前に慎重に検討してください。ただし、後でフィールドを ML モデルのトレーニングに使用しないと決めた場合は、そのフィールドを削除するか [フィールドを編集] ウィンドウの [非表示] チェックボックスをオンにして、そのフィールドを常に非表示にすることができます。
請求書ドキュメントの明細項目である説明または単価は、列フィールドの例となります。
- ページ上部の表セクションの アイコンをクリックし、新しい列フィールドを追加します。[新しい列フィールドを作成] ウィンドウが表示されます。
- [一意のフィールド名を入力] フィールドに、フィールドの一意の名前を入力します。このフィールドでは大文字は使用できません。小文字、数字、アンダースコア (
_
)、およびダッシュ (-
) のみを含めることができます。 - [作成] をクリックします。[フィールドを編集] ウィンドウが表示されます。
- [コンテンツの種類] ドロップダウン リストからコンテンツの種類を選択します。
- [スコアリング] ドロップダウン リストから、モデル予測の評価を実行する際の精度の決定に使用する尺度を選択します。
- [ホットキー] フィールドをクリックし、お使いのキーボードのキーを押すと、キーが自動的に設定されます。
- [色] フィールドに、フィールドの目的の色の 16 進コードを入力します。
- このフィールドを明細項目や表の行の区切り文字として使用する場合は、[項目を分割] チェックボックスをオンに選択します。行にこのフィールドが表示されている場合は、新しい明細項目または表の行と見なされます。通常は、請求書の明細項目の「明細金額」フィールドで使用されます。
- エクスポートされるデータセットにこのフィールドを含めたくない場合は、[非表示] チェックボックスをオンにします。
- [保存] をクリックして設定を保存します。
[フィールドを編集] ボタンをクリックします。列フィールドで利用可能なオプションは下表のとおりです。
オプション |
説明 |
---|---|
コンテンツの種類 |
フィールドのコンテンツの種類です。
|
ショートカット |
フィールドのショートカット キーです。1 つまたは 2 つのキーを使用できます。 |
色 |
フィールドの色です (16 進数表記)。値が有効でない場合、新しい値が生成されます。 |
スコアリング |
モデルの予測の評価を実行するときの精度を決定するために使用する尺度です。コンテンツの種類が string の場合にのみ設定できます。他のすべてのコンテンツの種類では、完全一致のスコアリング方法が使用されます。オプション:
|
項目を分割 |
このフィールドを明細項目や表の行の区切り文字として使用する場合は、このチェックボックスをオンにします。行にこのフィールドが表示されている場合は、新しい明細項目または表の行とみなされます。通常は、請求書の明細項目の「明細金額」フィールドで使用されます。 |
非表示 |
エクスポートされるデータセットにこのフィールドが含まれないようにしたい場合は、このチェックボックスをオンにします。 |
これらは、特定のドキュメントに 1 回だけ表示されるフィールドです。列フィールドの例としては、請求書ドキュメントの明細項目である請求書番号または合計金額があります。
- [標準フィールド] セクションの右側のペインで アイコンをクリックします。[新しい標準フィールドを作成] ウィンドウが表示されます。
- [一意のフィールド名を入力] フィールドに、フィールドの一意の名前を入力します。このフィールドでは大文字は使用できません。小文字、数字、アンダースコア (
_
)、およびダッシュ (-
) のみを含めることができます。 - [作成] をクリックします。[フィールドを編集] ウィンドウが表示されます。
- [コンテンツの種類] ドロップダウン リストからコンテンツの種類を選択します。
- 指定したページ上の単一のフィールドで、モデルが複数のインスタンスを予測する場合は、[後処理] ドロップダウン リストから後処理のメカニズムを選択します。
- [ホットキー] フィールドをクリックし、お使いのキーボードのキーを押すと、キーが自動的に設定されます。
- [色] フィールドに、目的のフィールドの色の 16 進コードを入力します。
- [複数ページ] ドロップダウン リストから、データの取得方法を選択します。このオプションは、複数のページを持つドキュメントのいくつかの異なるページにフィールドが表示される場合に使用します。このオプションでは、モデルが返す結果の決定方法を定義します。
- [スコアリング] ドロップダウン リストから、モデル予測の評価を実行する際の精度の決定に使用する尺度を選択します。
- 確認対象のフィールドが、住所や説明のように、複数のテキスト行にまたがる可能性がある場合は、[複数行] チェック ボックスをオンにします。このオプションをオンにしない場合は、最初の行だけが返されます。
- エクスポートされるデータセットにこのフィールドを含めたくない場合は、[非表示] チェックボックスをオンにします。
- [保存] をクリックして設定を保存します。
[フィールドを編集] ボタンをクリックします。標準フィールドで利用可能なオプションは下表のとおりです。
オプション |
説明 |
---|---|
コンテンツの種類 |
フィールドのコンテンツの種類です。
|
後処理 |
後処理のメカニズムです。モデルは、指定したページでフィールドが複数箇所に出現すると予測した場合、以下の値を返します。
|
ショートカット |
フィールドのショートカット キーです。1 つまたは 2 つのキーを使用できます。 |
色 |
フィールドの色です (16 進数表記)。値が有効でない場合、新しい値が生成されます。 |
複数ページ |
複数ページのドキュメントの異なるページにフィールドが表示される場合にデータを返す方法です。
|
スコアリング |
モデルの予測の評価を実行するときの精度を決定するために使用する尺度です。コンテンツの種類が string の場合にのみ設定できます。他のすべてのコンテンツの種類では、完全一致のスコアリング方法が使用されます。オプション:
|
複数行 |
複数のテキスト行にまたがる可能性があるフィールド (住所や説明) の場合に、このチェックボックスをオンにします。オンにしない場合は、最初の行だけが返されます。 |
非表示 |
エクスポートされるデータセットにこのフィールドが含まれないようにしたい場合は、このチェックボックスをオンにします。 |
ドキュメント全体を参照するデータ ポイントです。たとえば、領収書の経費の種類 (飲食、宿泊、飛行機、輸送) または請求書の通貨 (米ドル、ユーロ、日本円) が分類フィールドの例となります。
- [分類フィールド] セクションの右側のペインで アイコンをクリックします。[新しい分類フィールドを作成] ウィンドウが表示されます。
- [一意のフィールド名を入力] フィールドに、フィールドの一意の名前を入力します。このフィールドでは大文字は使用できません。小文字、数字、アンダースコア (
_
)、およびダッシュ (-
) のみを含めることができます。 - [作成] をクリックします。[フィールドを編集] ウィンドウが表示されます。
- テキスト領域にクラスのリストを入力し、名前をコンマ区切りのリストとして入力します。
- [保存] をクリックして設定を保存します。
:
) の後に入力できます (オプション 1: 説明 1)。