document-understanding
latest
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
UiPath logo, featuring letters U and I in white

Document Understanding モダン プロジェクト ユーザー ガイド

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
最終更新日時 2025年2月5日

アノテーションのベスト プラクティス

アノテーション プロセスを開始する前に、特定の種類のドキュメントに必要なすべてのフィールドを網羅したリストを作成することが重要です。混同を防ぐため、各フィールドは明確に定義してください。好みに応じて、サンプル ドキュメントを例として使用してアノテーションを行ったり、各フィールドを説明する詳細な表を作成したりできます。

一般的なガイドライン

アノテーション プロセスでは、次の 2 つの主要なフィールドの種類を明確に理解する必要があります。
  • 列フィールド
  • 標準フィールド
列フィールドは、特に表領域に存在する情報をキャプチャするように設計されているのに対し、標準フィールドは、ドキュメントのその他の部分から情報を取得します。

あるフィールドが、同じドキュメント内に同じ値で複数回出現することが分かった場合は、そのフィールドの各インスタンスにアノテーションを行います。たとえば、請求書番号がドキュメントの上部と下部の両方に出現する場合は、両方のインスタンスにアノテーションを行う必要があります。

値が異なる場合は、正しい値にのみアノテーションを行う必要があります。これは、同じベンダーの異なるドキュメントやバリエーションの間で値が異なる場合にも当てはまる可能性があります。このような状況では、まれに違う値がある場合はその値を無視してでも、常にベンダーの一貫性を優先することが重要です。

重要な原則は、類似するレイアウトにアノテーションを行う場合に一貫性を維持することです。これにより、クリーンで均一なデータが保証されます。

さらに、アノテーション済みのデータがすべて完全であることを確認します。住所に含まれる単語やその他の重要な情報が見落とされないようにダブルチェックしてください。

最後に、必要なアノテーション ボックスのみをフィールドに配置します。たとえば、Date: 28-11-2022 に日付としてアノテーションを行った場合、Date: は必ず削除してください。これにより、情報を簡潔かつ正確に保つことができます。

表に関するガイドライン

複数の表を操作する場合は、すべての表の列ごとに専用の列フィールドが必要であることに注意してください。このプロセスは、データを正確かつ効果的にキャプチャするために重要です。

図 1. 表の各列に関連付けられた列フィールド

表にアノテーションを行う場合、必ず表の行をグループ化してください。そのためには、行全体を選択して、ホットキー / を使用します。これにより、それらのフィールドが関連付けられ、より効率的に表を処理できるようになります。
表の行が複数のページに分割されていても、すべてのセルを 1 つの行にグループ化できます。グループ化するには、Ctrl + 左クリックを使用して行に属するすべてのフィールドを選択し、/ を選択するだけです。こうすることで、行が複数のページにまたがっていても、シームレスに読み取ることができます。
図 2. 複数のページに分割された表の行

  • 一般的なガイドライン
  • 表に関するガイドライン

このページは役に立ちましたか?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
Uipath Logo White
信頼とセキュリティ
© 2005-2025 UiPath. All rights reserved.