UiPath Documentation
document-understanding
2023.4
false
  • 概要
    • はじめに
    • 機能の概要
    • 言語サポート
    • AI Center と Document Understanding の関係
  • Document Understanding Process
    • Document Understanding™ Process: Studio のテンプレート
  • クイック スタート チュートリアル
    • 領収書からデータを抽出する
    • 請求書のフィールドを 1 つ追加して再トレーニングする
    • フォームからデータを抽出する
  • フレームワーク コンポーネント
    • タクソノミー
      • タクソノミー マネージャー
      • タクソノミーの概要
      • タクソノミー関連のアクティビティ
    • デジタル化
      • デジタル化の概要
      • デジタル化関連のアクティビティ
      • OCR エンジン
    • ドキュメント分類
      • ドキュメント分類の概要
      • [ドキュメント分類スコープ] の分類器を設定ウィザード
      • FlexiCapture 分類器
      • インテリジェント キーワード分類器
      • キーワード ベースの分類器
      • マシン ラーニング分類器
      • ドキュメント分類関連のアクティビティ
    • ドキュメント分類の検証
      • ドキュメント分類の検証の概要
      • 分類ステーション
      • ドキュメント分類の検証関連のアクティビティ
    • ドキュメント分類トレーニング
      • [分類器トレーニング スコープ] の分類器を設定ウィザード
      • ドキュメント分類トレーニングの概要
      • ドキュメント分類トレーニング関連のアクティビティ
      • マシン ラーニング分類器トレーナー
    • データ抽出
      • [データ抽出スコープ] の抽出器を設定ウィザード
      • データ抽出の概要
      • データ抽出関連のアクティビティ
      • FlexiCapture 抽出器
      • フォーム抽出器
      • インテリジェント フォーム抽出器
      • マシン ラーニング抽出器
      • 正規表現ベースの抽出器
    • データ抽出の検証
      • データ抽出の検証の概要
      • データ抽出の検証関連のアクティビティ
      • 検証ステーション
    • データ抽出トレーニング
      • [抽出器トレーニング スコープ] の抽出器を設定ウィザード
      • データ抽出トレーニングの概要
      • データ抽出トレーニング関連のアクティビティ
      • マシン ラーニング抽出器トレーナー
    • データ消費
      • データ消費の概要
      • データ消費関連のアクティビティ
  • ML パッケージ
    • 概要
    • Document Understanding - ML パッケージ
    • DocumentClassifier (ドキュメント分類) - ML パッケージ
    • OCR 機能を持つ ML パッケージ
    • Out-of-the-box Pre-trained ML Packages
      • 1040 (米国の個人所得税申告書) - ML パッケージ
      • 4506T (米国の納税申告証明依頼書) - ML パッケージ
      • 990 (米国の所得税非課税団体申告書) - ML パッケージ (プレビュー)
      • ACORD125 (企業向け保険契約申込書) - ML パッケージ
      • ACORD126 (企業総合賠償責任保険) - ML パッケージ
      • ACORD131 (アンブレラ/エクセス保険) - ML パッケージ
      • ACORD140 (商業保険申込書の財物補償条項) - ML パッケージ
      • ACORD25 (賠償責任保険証明書) - ML パッケージ
      • Bank Statements (銀行預金残高証明書) - ML パッケージ
      • BillsOfLading (船荷証券) - ML パッケージ
      • Certificate of Incorporation (会社存在証明書) - ML パッケージ
      • Certificate of Origin (原産地証明書) - ML パッケージ
      • Checks (小切手) - ML パッケージ
      • Children's Product Certificate (子供向け製品証明書) - ML パッケージ
      • CMS 1500 (米国の医療保険請求フォーム) - ML パッケージ
      • EU Declaration of Conformity (EU 適合宣言書) - ML パッケージ
      • Financial Statements (財務諸表) - ML パッケージ
      • FM1003 (米国の統一住宅ローン申請書) - ML パッケージ
      • I9 (米国の就労資格証明書) - ML パッケージ
      • ID Cards (ID カード) - ML パッケージ
      • Invoices (請求書) - ML パッケージ
      • InvoicesAustralia (請求書 - オーストラリア) - ML パッケージ
      • InvoicesChina (請求書 - 中国) - ML パッケージ
      • InvoicesIndia (請求書 - インド) - ML パッケージ
      • InvoicesJapan (請求書 - 日本) - ML パッケージ
      • Invoices Shipping (船積送り状) - ML パッケージ
      • Packing Lists (梱包明細書) - ML パッケージ
      • Passports (パスポート) - ML パッケージ
      • Payslips (給与明細) - ML パッケージ
      • Purchase Orders (発注書) - ML パッケージ
      • Receipts (領収書) - ML パッケージ
      • RemittanceAdvices (送金通知書) - ML パッケージ
      • Utility Bills (公共料金の請求書) - ML パッケージ
      • Vehicle Titles (自動車の権利書) - ML パッケージ
      • W2 (米国の源泉徴収票) - ML パッケージ
      • W9 (米国の納税申告書) - ML パッケージ
    • その他のすぐに使える ML パッケージ
    • パブリック エンドポイント
    • サポートされている言語
      • OCR
      • ML パッケージ
      • その他
    • ハードウェア要件
  • パイプライン
    • パイプラインについて
    • トレーニング パイプライン
    • 評価パイプライン
    • フル パイプライン
    • 微調整する
    • 自動微調整ループ (パブリック プレビュー)
  • Document Manager
    • ドキュメントの種類を作成する
    • ユーザー インターフェイス
    • Document Manager にアクセスする
    • フィールドを作成および設定する
    • ドキュメントをインポートする
    • ドキュメントにラベル付けする
    • ドキュメントを検索する
    • ドキュメントをエクスポートする
    • チェックボックスと署名
    • データセット診断
  • OCR サービス
    • OCR サービス
  • ディープ ラーニング
    • 優れたパフォーマンスのモデルをトレーニングする
    • 優れたパフォーマンスのモデルをデプロイする
  • Automation Suite にデプロイされた Document Understanding
    • インストールして使用する
    • 初回の操作
    • UiPathDocumentOCR をデプロイする
    • すぐに使える ML パッケージをデプロイする
    • ML パッケージのオフライン インストール
      • オフライン バンドル 2023.4.13+patch1
      • オフライン バンドル 2023.4.13
      • オフライン バンドル 2023.4.12
      • オフライン バンドル 2023.4.11
      • オフライン バンドル 2023.4.10+patch1
      • オフライン バンドル 2023.4.10
      • オフライン バンドル 2023.4.9
      • オフライン バンドル 2023.4.8
      • オフライン バンドル 2023.4.7
      • オフライン バンドル 2023.4.6
      • オフライン バンドル 2023.4.5
      • オフライン バンドル 2023.4.4
      • オフライン バンドル 2023.4.3
      • オフライン バンドル 2023.4.2
      • オフライン バンドル 2023.4.1
      • オフライン バンドル 2023.4.0
    • Document Manager を使用する
    • フレームワークを使用する
  • AI Center スタンドアロンにデプロイされた Document Understanding
    • インストールして使用する
    • 初回の操作
    • Document Manager を使用する
    • フレームワークを使用する
  • ライセンス
    • API キー
    • クラウドおよびオンプレミスでの使用
    • 使用状況の測定と請求ロジック (フレックス プラン)
    • 法的情報
  • Activities (アクティビティ)
    • アクティビティ パッケージ
      • UiPath.Abbyy.Activities
      • UiPath.AbbyyEmbedded.Activities
      • UiPath.DocumentProcessing.Contracts
      • UiPath.DocumentUnderstanding.ML.Activities
      • UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
      • UiPath.IntelligentOCR.Activities
      • UiPath.OCR.Activities
      • UiPath.OCR.Contracts
      • UiPath.OmniPage.Activities
      • UiPath.PDF.Activities
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
UiPath logo, featuring letters U and I in white

Document Understanding ガイド

最終更新日時 2025年12月4日

データ抽出トレーニングの概要

データ抽出トレーニングとは

データ抽出トレーニングは Document UnderstandingTM フレームワークのコンポーネントです。人間によるフィードバックから学習する能力を持つ抽出器のフィードバック ループを閉じるのに役立つます。このトレーニングは、追加のドキュメントに対する抽出器のパフォーマンスを (それぞれの学習能力に応じて) 向上させるのに役立ちます。

データ抽出トレーニングを使用すべき場合

トレーニング コンポーネントを含まない Document Understanding プロセスが構築される場合があります。これは、いくつかの理由で起きる可能性があります。その一部を以下に示します。

  • 使用している抽出器が再トレーニングをサポートしていない
  • 再トレーニングを実行するのではなく、プロセスでは常に同じトレーニングを使用したい
  • 抽出器トレーニングをオフラインで更新したいと考えており、その更新を DU プロセス外で管理している

しかし、ほとんどの場合、通常のプロセス使用の一環として抽出器をトレーニングすることには、大きなメリットがあります。抽出器は人間による検証情報を取り込んで、独自のトレーニング データを収集し、独自の更新を実行できるからです。ユーザーが何らかの方法で既存のワークフローを更新する必要はありません。抽出器は、人間が正しいデータとして検証したデータに基づいて、将来より適切に機能するよう自ら学ぶことができる、自己学習型アルゴリズムになります。

データ抽出トレーニング コンポーネントの使用方法

データ抽出トレーニングは、[抽出器トレーニング スコープ] アクティビティを使用して行われます。このスコープ アクティビティには、一度に 1 つ以上の抽出器トレーニング アルゴリズムを設定して実行する役割があるため、1 つ以上の抽出器をトレーニングできます。

データ抽出トレーニングは通常、データ抽出の検証後に実行されます。アルゴリズムが受け取るトレーニング データの精度を確保するため、トレーニング用には、人間が確認したフィードバックのみを分類器に送り返す必要があります。

データ抽出トレーニングは、自動的に抽出されたデータが正しい (修正が不要) 場合だけでなく、人間による修正の場合にも実行する必要があります。これは、どちらのケースもアルゴリズムの学習に役立つためです。

データ抽出コンポーネントで使用されている抽出器と、データ抽出の予測に使用されていない抽出器の両方をトレーニングできます。後者のアプローチは、後で Document Understanding ワークフローに追加して使用するために、トレーニング データを収集して、ゼロから抽出器をトレーニングする場合に使用されます。

[抽出器トレーニング スコープ] で行われることを、以下に簡潔にまとめます。

  • すべての抽出器トレーナー (トレーニング アルゴリズム) の実行に必要な設定を指定します。
  • 1 つ以上の抽出器トレーナーを受け入れます。
  • ドキュメントの種類とフィールド レベルのフィルター処理、およびプロジェクトのタクソノミーと内部抽出器のタクソノミーの間のマッピングを可能にします。

[抽出器トレーニング スコープ] は、[抽出器を設定] ウィザードを使用して抽出器を設定できます。以下をカスタマイズできます。

  • トレーニングのために、どのドキュメントの種類およびどのフィールドが、どの抽出器トレーナーに送信されるか
  • ドキュメントの種類のレベルおよびフィールド レベルでの、プロジェクトのタクソノミーと抽出器の内部タクソノミー (ある場合) 間のタクソノミー マッピング

抽出器トレーニング スコープでは、抽出器 - 抽出器トレーナーのアクティビティのペアを一意に特定することもでき、そのためにデータ抽出器スコープとトレーニング スコープの両方で同じフレームワーク エイリアス文字列が使用されます。

利用可能な抽出器トレーナー

現在、トレーニング/再トレーニング機能が備わっているのは、マシン ラーニング抽出器だけです。このアクティビティは UiPath.DocumentUnderstanding.ML.Activities パッケージ内にあり、そのトレーニング アクティビティをマシン ラーニング抽出器トレーナーと呼びます。

このページは役に立ちましたか?

接続

ヘルプ リソース サポート

学習する UiPath アカデミー

質問する UiPath フォーラム

最新情報を取得