document-understanding
2024.10
true
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
UiPath logo, featuring letters U and I in white

Document Understanding モダン プロジェクト ユーザー ガイド

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
最終更新日時 2024年11月20日

ドキュメントの種類

ドキュメントの種類は、さまざまな業務プロセスで処理する必要のある、ドキュメントの論理的な種類の定義です。

ドキュメントの種類とその内容

ドキュメントの種類には、請求書、医療記録、IRS フォーム W-2、契約書などがあります。ドキュメントの種類には通常、名前、グループ、カテゴリのほかに、フィールドのコレクションが含まれます。

たとえば、請求書には通常、次の情報が含まれています。
  • Vendor Name (業者名)、Vendor Address (業者住所)、Billing Name (請求先宛名)、Billing Address (請求先住所)
  • Invoice Number (請求書番号)、Purchase Order Number (発注書番号)、Payment Terms (支払条件)、Due Date (期限日)
  • Net Amount (正味金額)、Tax Amount (税額)、Discount (割引)、Total Amount (合計金額)
  • VAT Number (VAT 番号)、VAT Rate (VAT 率)
  • 銀行の口座番号、銀行名、SWIFT、IBAN
図 1. 請求書の例

ドキュメントの種類の形式

ドキュメントの種類は、形式に基づいて分類できます。非常に構造化されたコンテンツを持つドキュメントの種類もあれば、主にフリー テキストで構成されるドキュメントの種類もあります。

ドキュメントは、主に次の 3 つの形式に分類されます。
  • Structured
  • 半構造化
  • 非構造化データ
注: ドキュメントは、多くの場合、これら 3 つのカテゴリが組み合わさっています。ファイルには、構造化された見出しの後に、構造化されていない自由形式のコンテンツを含めることができます。また、非常に構造化されたコンテキストまたは繰り返しのコンテキストで常に表示される特定の情報を含む非構造化コンテンツを含めることもできます。

構造化ドキュメント

構造化ドキュメントには、次のものが含まれます。
  • アンケート
  • アンケート
  • 納税申告書
  • Passports (パスポート)
  • ライセンス
  • タイム シート

これらのドキュメントは、特定の形式で情報を収集するように設計されています。通常、キーと値のペア、表、手書きのテキスト、署名、チェックボックスが含まれます。これらのドキュメントは、各データを入力する正確な領域を提示してユーザーをガイドします。このようなドキュメントは一般にフォームと呼ばれ、多様性の低いデータを収集するために使用されます。

図 2. 構造化ドキュメントの例として運転免許証 docs image

半構造化ドキュメント

半構造化ドキュメントとは、構造化フォームのような厳密な形式に従わず、指定されたデータ フィールドに縛られないドキュメントです。これらは固定された形式を持っていませんが、一般的な形式に従います。テーブルのように固定部分と可変部分が含まれています。段落を含めることもできますが、データは主にキーと値のペアとして存在します。半構造化ドキュメントには、次のものが含まれます。
  • Invoices (請求書)
  • Receipts (領収書)
  • Purchase Orders (発注書)
  • 医療の臨床検査結果
  • Bank Statements (銀行預金残高証明書)
  • Utility Bills (公共料金の請求書)
図 3. 半構造化ドキュメントの例として請求書 docs image

非構造化ドキュメント

非構造化ドキュメントとは、特定のモデルや整理されたモデルに従わないファイルのことです。テンプレートには固定の形式がなく、含まれる情報が構造化されていない方法で表示されることが多いため、ロボットによる処理が困難になります。人間はこれらのドキュメントを簡単に理解できますが、データは機械が解釈するのが難しい場合があります。非構造化ドキュメントには、次のようなさまざまな形式があります。
  • Contracts (コントラクト)
  • 賃貸契約書
  • 年次報告書
  • 契約
  • ニュース記事
図 4. 非構造化ドキュメントの例としてライセンス契約書 docs image

このページは役に立ちましたか?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
Uipath Logo White
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.