document-understanding
latest
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
UiPath logo, featuring letters U and I in white

Document Understanding モダン プロジェクト ユーザー ガイド

最終更新日時 2025年6月5日

ドキュメントのアノテーションを行う

注: 事前ラベル付け機能は UiPath DocPath に依存しますが、欧州リージョンに拠点を置くテナントのみが対象です。テナントが欧州以外のリージョンにある場合は、前世代のモデル アーキテクチャが使用されます。

プロジェクトが正常に作成され、ドキュメントを特定のドキュメントの種類にアップロードすると、ドキュメントに自動的にアノテーションが行われます。これは、ドキュメントの種類のスキーマに基づいて、生成 AI のモデルと専門家されたモデルを組み合わせて行なわれます。このスキーマでは、特定のドキュメントの種類から抽出するフィールドが明確に定義されています。ドキュメントの種類のスキーマを確認するには、[アノテーション] ページに移動して [フィールド] セクションを確認します。



Predictions are indicated with underlines on the text within the document and they can't be deleted. If they are incorrect and cannot be matched to a particular field, you can ignore them. During the training process, only confirmed fields are used for training, while the underlines are not taken into account.

As you continue to add more annotations, the prediction underlines should progressively align with your input. There may be a few inconsistencies between underlines and user-annotated fields at the beginning. However, as you make more annotations and the model improves, the underlines should line up more precisely with the user-supplied data.

In the following image, the Shipping Address has been incorrectly predicted to include the person's name.



これを修正するには、配送先住所を確認するだけです。名前に関連する下線付きのテキストを削除する必要はありません。アノテーションを続行してこのようなエラーを修正していくと、下線付きのテキストが確認済みのフィールドと一致しないケースが減っていきます。

ヒント: モデルのトレーニングをトリガーするには、40 以上の操作が必要です。たとえば、ドキュメントが 20 個ある場合、ドキュメント 1 個につき 2 つ以上のフィールドに注釈を付ける必要があるため、合計で 40 の操作が必要になります。
ヒント: モデルのパフォーマンスを最適化するには、[推奨事項] セクションの提案に従います。これらの提案は、モデルの全体的なパフォーマンスを向上させることを目的としています。


Extractions view

You can change the extractions view mode using the Extractions view menu. To access this, select the three-dot icon on the right side of the document type name and select Extractions view.

Filtered values consist of predictions, which are read-only, and annotations, which can be edited by the user.



You can select the following extraction views from the list:
  • Merge by column: model predictions are displayed in columns that do not have any annotations. Choose this for smaller tables where you can view and validate the whole column.
  • Merge by row: model predictions are displayed in rows that do not have any annotations. Choose this when you have larger tables and you want to validate row by row.
  • Only confirmed: only extracted values for user confirmed annotations are displayed.
  • Only predicted: only display model predictions. Updated automatically when model is retrained and is not editable.
  • Show side panel: display the panel on the left side with annotation fields.
  • Show table: display the table annotation panel.

Validate predicted documents

After all documents are uploaded and predicted, your goal is to either validate or modify the pre-annotated fields. For a document where all fields are accurately predicted, select Confirm to approve all fields at once. A document, once confirmed, will be signified with a green shield symbol in the document list.



ドキュメントが部分的にしか確認されていない場合は、ドキュメント リストで空の盾の記号が付きます。この記号は、この特定のドキュメントのアノテーション プロセスが進行中であることを示します。最終的な目標は、すべてのドキュメントを確認済みにすることです。

検証中に、次のシナリオが発生する可能性があります。
  • Prediction is correct and should be validated.
  • Prediction is not correct and the field is present on the document.
  • Prediction is not correct and the field is missing from the document.
  • There is no prediction.

Prediction is correct and should be validated

If the prediction is accurate, you can confirm it by either selecting the underlined text and selecting Confirm or checking the confirmation checkbox for the field. The optimal method, however, is to press the hotkey assigned to the field (“N” in this scenario).


Prediction is incorrect and the field is present on the document

If the prediction is incorrect, select the correct text from the document and the appropriate field from the dropdown, then select Confirm.

When working with tables, you can choose to ignore incorrectly predicted values. These values will not be used for model training, and the retrained model will learn to avoid predicting them in future iterations.

Prediction is incorrect and the field is missing from the document

If there prediction is incorrect and the field is missing from the document, select the three-dot icon next to the field name and select Mark as missing.
重要: 間違ったラベルが付けられたフィールドは、存在しないとしてマークすることもできます。たとえば、ドキュメント内に [ベンダー住所] は存在しないが、処理中に別のフィールドが [ベンダー住所] として事前にラベル付けされていた場合、検証中にそのフィールドを存在しないとしてマークできます。


No prediction

Fields that have no prediction are displayed as empty cells. You can mark these cells as missing one by one, or in bulk by selecting the Confirm button.

ドキュメントの種類の設定

ドキュメントの種類の設定は、[アノテーションを行う] ビューから変更できます。

To do so, select the three-dot icon on the right side of the document type name and select Settings.



次の設定を変更できます。
  • ベース モデル: [推奨されるアクション] に表示されるデータセットのサイズの推定値は、トレーニングに使用されるベース モデルによって異なります。対象のドキュメントの種類に最も類似したベース モデルを使用すると、必要とされるアノテーション作業量が減ります。
  • 言語の数: [推奨されるアクション] に表示されるデータセットのサイズの推定値は、データセットに含まれる言語の数によって異なります。一般には、言語の数が多いほど、より多くのデータのアノテーションを行う必要があります。

このページは役に立ちましたか?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
Uipath Logo White