UiPath Documentation
document-understanding
2023.4
false
  • 概要
    • はじめに
    • 機能の概要
    • 言語サポート
    • AI Center と Document Understanding の関係
  • Document Understanding Process
    • Document Understanding™ Process: Studio のテンプレート
  • クイック スタート チュートリアル
    • 領収書からデータを抽出する
    • 請求書のフィールドを 1 つ追加して再トレーニングする
    • フォームからデータを抽出する
  • フレームワーク コンポーネント
    • タクソノミー
      • タクソノミー マネージャー
      • タクソノミーの概要
      • タクソノミー関連のアクティビティ
    • デジタル化
      • デジタル化の概要
      • デジタル化関連のアクティビティ
      • OCR エンジン
    • ドキュメント分類
      • ドキュメント分類の概要
      • [ドキュメント分類スコープ] の分類器を設定ウィザード
      • FlexiCapture 分類器
      • インテリジェント キーワード分類器
      • キーワード ベースの分類器
      • マシン ラーニング分類器
      • ドキュメント分類関連のアクティビティ
    • ドキュメント分類の検証
      • ドキュメント分類の検証の概要
      • 分類ステーション
      • ドキュメント分類の検証関連のアクティビティ
    • ドキュメント分類トレーニング
      • [分類器トレーニング スコープ] の分類器を設定ウィザード
      • ドキュメント分類トレーニングの概要
      • ドキュメント分類トレーニング関連のアクティビティ
      • マシン ラーニング分類器トレーナー
    • データ抽出
      • [データ抽出スコープ] の抽出器を設定ウィザード
      • データ抽出の概要
      • データ抽出関連のアクティビティ
      • FlexiCapture 抽出器
      • フォーム抽出器
      • インテリジェント フォーム抽出器
      • マシン ラーニング抽出器
      • 正規表現ベースの抽出器
    • データ抽出の検証
      • データ抽出の検証の概要
      • データ抽出の検証関連のアクティビティ
      • 検証ステーション
    • データ抽出トレーニング
      • [抽出器トレーニング スコープ] の抽出器を設定ウィザード
      • データ抽出トレーニングの概要
      • データ抽出トレーニング関連のアクティビティ
      • マシン ラーニング抽出器トレーナー
    • データ消費
      • データ消費の概要
      • データ消費関連のアクティビティ
  • ML パッケージ
    • 概要
    • Document Understanding - ML パッケージ
    • DocumentClassifier (ドキュメント分類) - ML パッケージ
    • OCR 機能を持つ ML パッケージ
    • Out-of-the-box Pre-trained ML Packages
      • 1040 (米国の個人所得税申告書) - ML パッケージ
      • 4506T (米国の納税申告証明依頼書) - ML パッケージ
      • 990 (米国の所得税非課税団体申告書) - ML パッケージ (プレビュー)
      • ACORD125 (企業向け保険契約申込書) - ML パッケージ
      • ACORD126 (企業総合賠償責任保険) - ML パッケージ
      • ACORD131 (アンブレラ/エクセス保険) - ML パッケージ
      • ACORD140 (商業保険申込書の財物補償条項) - ML パッケージ
      • ACORD25 (賠償責任保険証明書) - ML パッケージ
      • Bank Statements (銀行預金残高証明書) - ML パッケージ
      • BillsOfLading (船荷証券) - ML パッケージ
      • Certificate of Incorporation (会社存在証明書) - ML パッケージ
      • Certificate of Origin (原産地証明書) - ML パッケージ
      • Checks (小切手) - ML パッケージ
      • Children's Product Certificate (子供向け製品証明書) - ML パッケージ
      • CMS 1500 (米国の医療保険請求フォーム) - ML パッケージ
      • EU Declaration of Conformity (EU 適合宣言書) - ML パッケージ
      • Financial Statements (財務諸表) - ML パッケージ
      • FM1003 (米国の統一住宅ローン申請書) - ML パッケージ
      • I9 (米国の就労資格証明書) - ML パッケージ
      • ID Cards (ID カード) - ML パッケージ
      • Invoices (請求書) - ML パッケージ
      • InvoicesAustralia (請求書 - オーストラリア) - ML パッケージ
      • InvoicesChina (請求書 - 中国) - ML パッケージ
      • InvoicesIndia (請求書 - インド) - ML パッケージ
      • InvoicesJapan (請求書 - 日本) - ML パッケージ
      • Invoices Shipping (船積送り状) - ML パッケージ
      • Packing Lists (梱包明細書) - ML パッケージ
      • Passports (パスポート) - ML パッケージ
      • Payslips (給与明細) - ML パッケージ
      • Purchase Orders (発注書) - ML パッケージ
      • Receipts (領収書) - ML パッケージ
      • RemittanceAdvices (送金通知書) - ML パッケージ
      • Utility Bills (公共料金の請求書) - ML パッケージ
      • Vehicle Titles (自動車の権利書) - ML パッケージ
      • W2 (米国の源泉徴収票) - ML パッケージ
      • W9 (米国の納税申告書) - ML パッケージ
    • その他のすぐに使える ML パッケージ
    • パブリック エンドポイント
    • サポートされている言語
      • OCR
      • ML パッケージ
      • その他
    • ハードウェア要件
  • パイプライン
    • パイプラインについて
    • トレーニング パイプライン
    • 評価パイプライン
    • フル パイプライン
    • 微調整する
    • 自動微調整ループ (パブリック プレビュー)
  • Document Manager
    • ドキュメントの種類を作成する
    • ユーザー インターフェイス
    • Document Manager にアクセスする
    • フィールドを作成および設定する
    • ドキュメントをインポートする
    • ドキュメントにラベル付けする
    • ドキュメントを検索する
    • ドキュメントをエクスポートする
    • チェックボックスと署名
    • データセット診断
  • OCR サービス
    • OCR サービス
  • ディープ ラーニング
    • 優れたパフォーマンスのモデルをトレーニングする
    • 優れたパフォーマンスのモデルをデプロイする
  • Automation Suite にデプロイされた Document Understanding
    • インストールして使用する
    • 初回の操作
    • UiPathDocumentOCR をデプロイする
    • すぐに使える ML パッケージをデプロイする
    • ML パッケージのオフライン インストール
      • オフライン バンドル 2023.4.13+patch1
      • オフライン バンドル 2023.4.13
      • オフライン バンドル 2023.4.12
      • オフライン バンドル 2023.4.11
      • オフライン バンドル 2023.4.10+patch1
      • オフライン バンドル 2023.4.10
      • オフライン バンドル 2023.4.9
      • オフライン バンドル 2023.4.8
      • オフライン バンドル 2023.4.7
      • オフライン バンドル 2023.4.6
      • オフライン バンドル 2023.4.5
      • オフライン バンドル 2023.4.4
      • オフライン バンドル 2023.4.3
      • オフライン バンドル 2023.4.2
      • オフライン バンドル 2023.4.1
      • オフライン バンドル 2023.4.0
    • Document Manager を使用する
    • フレームワークを使用する
  • AI Center スタンドアロンにデプロイされた Document Understanding
    • インストールして使用する
    • 初回の操作
    • Document Manager を使用する
    • フレームワークを使用する
  • ライセンス
    • API キー
    • クラウドおよびオンプレミスでの使用
    • 使用状況の測定と請求ロジック (フレックス プラン)
    • 法的情報
  • Activities (アクティビティ)
    • アクティビティ パッケージ
      • UiPath.Abbyy.Activities
      • UiPath.AbbyyEmbedded.Activities
      • UiPath.DocumentProcessing.Contracts
      • UiPath.DocumentUnderstanding.ML.Activities
      • UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
      • UiPath.IntelligentOCR.Activities
      • UiPath.OCR.Activities
      • UiPath.OCR.Contracts
      • UiPath.OmniPage.Activities
      • UiPath.PDF.Activities
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
UiPath logo, featuring letters U and I in white

Document Understanding ガイド

最終更新日時 2025年12月4日

はじめに

UiPath®Document UnderstandingTM フレームワークを使用することで、オープンで拡張可能かつ幅広い用途で使える環境において、あらゆる受信ファイルの処理 (ファイルのデジタル化から抽出データの検証まで) を、円滑に行うことができます。

Document Understanding は、様々なドキュメントの種類から情報を抽出するために、異なるアプローチを組み合わることができるよう設計されています。さまざまなドキュメントからデータを抽出する単一のワークフローを作成することで、データ抽出プロセスをできるだけシンプルにします。

Document Understanding フレームワークを使用する前に、以下の Document Understanding フレームワーク コンポーネントを理解しておくことをお勧めします。

  • タクソノミー 処理するドキュメントと抽出するデータを定義ドキュメントの種類と、データ抽出の対象となる情報の断片 (フィールド) を定義し、情報を専用のタクソノミー構造に形式化します。このメタデータ情報は、タクソノミー マネージャーで管理されます。
  • デジタル化 ファイルのコンテンツを取得受け取るドキュメントのテキスト コンテンツと構造を取得し、ファイルを機械判読可能なコンテンツに変換して、下流でさらに処理できるようにするために使用します。
  • ドキュメント分類 ファイル内のドキュメントの種類を特定 デジタル化されたファイルに含まれるドキュメントの種類を自動的に特定するために使用します。
  • ドキュメント分類の検証 予想した分類が正しいか確認 (人間によるレビューおよび修正)自動分類およびドキュメント分割の結果の人間による検証および修正をサポートするために使用します。
  • 分類トレーニング 人間のレビュー結果のロボットへのフィードバック人間が検証した情報を分類器に返し、それを使用して今後の予測を改善するために使用します。
  • データ抽出 ドキュメント内のデータの識別特定の入力ドキュメントおよび分類ページ範囲内で、識別されたドキュメントの種類で必要とされる情報をキャプチャするために使用します。
  • データ抽出の検証 抽出された情報が正しいか確認 (人間によるレビューおよび修正) 自動的に抽出されたデータ結果の、人間による検証および修正をサポートするために使用します。
  • データ抽出トレーニング 人間のレビュー結果のロボットへのフィードバック人間が検証した抽出データを抽出器に返し、それを使用して抽出予測を改善するために使用します。
  • データ消費: 検証済みデータをエクスポートして消費するために使用します。
  • 使用状況の測定と請求ロジック: 利用可能な各サービスのページあたりの消費単位の説明に使用します。

次の図は、Document Understanding フレームワークのコンポーネント間の関連を示しています。



Document Understanding フレームワークは、UiPath.IntelligentOCR.Activities パッケージに含まれています。UiPath.IntelligentOCR.Activities パッケージをインストールすると、UiPath Studio の最上部のリボンに [タクソノミー マネージャー] ウィザードが表示されます。このパッケージには、Document Understanding フレームワークの主要なアクティビティがすべて含まれています。

Document Understanding フレームワークの一部であるスコープ アクティビティ ([ドキュメント分類スコープ][データ抽出スコープ][分類器トレーニング スコープ][抽出器トレーニング スコープ]) を使用することで、ユース ケースに合わせてドキュメントの分類とデータ抽出のアルゴリズムを使用し、これらのアルゴリズムをトレーニングできます。

Document Understanding フレームワークは、すぐに使える分類器や抽出器だけでなく、カスタム作成された分類器や抽出器でも使用できます。UiPath.DocumentProcessing.Contracts パッケージの抽象クラスを使用して作成でき、「分類」系または「データ抽出」系のアクティビティとして実装できます。UiPath.OCR.Contracts パッケージの抽象クラスを使用して、カスタム作成の OCR エンジンを作成することもできます。

リソース

UiPath RPA アカデミーには、Document Understanding 専門のコースがあります。

UiPath コミュニティ フォーラムは、UiPath の成長著しいユーザー コミュニティから支援を受けられるフォーラムです。

  • リソース

このページは役に立ちましたか?

接続

ヘルプ リソース サポート

学習する UiPath アカデミー

質問する UiPath フォーラム

最新情報を取得