UiPath Documentation
document-understanding
2024.10
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
UiPath logo, featuring letters U and I in white

Document Understanding ガイド

最終更新日時 2026年4月6日

データ抽出の概要

データ抽出とは

Data Extraction is a component in the Document UnderstandingTM Framework that helps in identifying very specific information that you are interested in, from your document types.

データ抽出の対象となる情報は、プロジェクトのタクソノミーにおいて、そこで定義された特定のドキュメントの種類のフィールド リストとして定義されます。プロジェクトのタクソノミーに表示されないフィールドを、自動データ抽出用に設定することはできません。

Document Understanding フレームワークのデータ抽出手順により、設定された抽出器が、処理されているファイルの正しいフィールド リスト、正しいページ範囲に対して、正しい順序で呼び出されるようになります。つまり、同じファイル内で 2 つ以上のドキュメントの種類が特定された場合 (異なるページ範囲に対して)、データ抽出手順を複数回 (各分類結果に対して 1 回ずつ) 実行することが推奨されます。特定のページ範囲の 1 つの分類結果に対してデータ抽出を実行することで、データはそれらのページからのみ、そのドキュメントの種類のみを対象に抽出されるようになります。

データ抽出コンポーネントの使用方法

Data Extraction is done through the Data Extraction Scope activity. To extract data from documents, you can use one or more extractors, as the scope activity has the role of configuring and executing one or more algorithms for data extraction and of offering an easy, unitary configuration option for all your needs.

[データ抽出スコープ] で行われることを、以下に簡潔にまとめます。

  • すべての抽出器 (抽出アルゴリズム) の実行に必要な設定と入力を行います。
  • 1 つ以上の抽出器を受け入れます。
  • 抽出器レベルでのフィールド レベルのアクティブ化、タクソノミーのマッピング、および最小信頼度閾値の設定を可能にします。
  • 抽出されたデータを、その特定のデータを報告した抽出器に関係なく、統一された方法で報告します。

[データ抽出スコープ] は、抽出器を設定ウィザードを使用して設定できます。以下をカスタマイズできます。

  • 各抽出器から要求されるフィールド
  • 分類器ごとの、特定のデータ ポイント抽出器の最小信頼度閾値
  • フィールド レベルでの、プロジェクトのタクソノミーと抽出器の内部タクソノミー間のタクソノミー マッピング (ある場合)

You can mix and match extractors, in a hybrid approach, in which you can request a few fields be extracted by a certain Extractor, while other fields are extracted by a different extractor.

データ抽出に「フォールバック」ルールを実装することもできます。特定の抽出器が特定のフィールドの許容値を報告しない場合は、バックアップ抽出器を呼び出します。

[データ抽出スコープ] 内の抽出器の順序は重要です。

  • 抽出器は、左から優先的に実行されます。
  • フィールドの抽出値は、その抽出器に設定された最小信頼度閾値以上の信頼度がある場合にのみ許容されます。
  • 抽出器は、指定された分類ページ範囲のみ、かつ、[データ抽出スコープ] の設定に従って要求されたフィールドと前の抽出器からまだ許容できる結果を取得していないフィールドに対してのみ実行されます。
    重要:

    If the Data Extraction Scope does not request any field from a given extractor, then that extractor is not executed. This may be the case of an extractor not configured for a certain incoming document type, or the case of an extractor being used as "fall-back" and the previous extractors reported all expected data already.

使用できる抽出器

ユース ケースの要件に基づいて、抽出器と呼ばれる複数のデータ抽出アルゴリズムから選択できます。

You can use any extractor that is available in the UiPath.IntelligentOCR.Activities or UiPath.DocumentUnderstanding.ML.Activities package.

使用できる抽出器は次のとおりです。

公開されている Document Processing Contracts を使用していつでも独自の抽出器を構築し、ユース ケースに適したアルゴリズムを実装できます。

  • データ抽出とは
  • データ抽出コンポーネントの使用方法
  • 使用できる抽出器

このページは役に立ちましたか?

接続

ヘルプ リソース サポート

学習する UiPath アカデミー

質問する UiPath フォーラム

最新情報を取得