- 概要
- Document Understanding Process
- クイック スタート チュートリアル
- フレームワーク コンポーネント
- ML パッケージ
- 概要
- Document Understanding - ML パッケージ
- DocumentClassifier (ドキュメント分類) - ML パッケージ
- OCR 機能を持つ ML パッケージ
- 1040 (米国の個人所得税申告書) - ML パッケージ
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ML パッケージ
- 1040 Schedule D (米国の個人所得税申告書のスケジュール D) - ML パッケージ
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ML パッケージ
- 1040x (米国の個人所得税修正申告書) - ML パッケージ
- 3949a - ML パッケージ
- 4506T (米国の納税申告証明依頼書) - ML パッケージ
- 709 (米国の贈与税申告書) - ML パッケージ
- 941x (米国の雇用主による四半期連邦税修正申告書) - ML パッケージ
- 9465 (米国の分割納付申請書) - ML パッケージ
- 990 (米国の所得税非課税団体申告書) - ML パッケージ (プレビュー)
- ACORD125 (企業向け保険契約申込書) - ML パッケージ
- ACORD126 (企業総合賠償責任保険) - ML パッケージ
- ACORD131 (アンブレラ/エクセス保険) - ML パッケージ
- ACORD140 (商業保険申込書の財物補償条項) - ML パッケージ
- ACORD25 (賠償責任保険証明書) - ML パッケージ
- Bank Statements (銀行預金残高証明書) - ML パッケージ
- BillsOfLading (船荷証券) - ML パッケージ
- Certificate of Incorporation (会社存在証明書) - ML パッケージ
- Certificate of Origin (原産地証明書) - ML パッケージ
- Checks (小切手) - ML パッケージ
- Children's Product Certificate (子供向け製品証明書) - ML パッケージ
- CMS 1500 (米国の医療保険請求フォーム) - ML パッケージ
- EU Declaration of Conformity (EU 適合宣言書) - ML パッケージ
- Financial Statements (財務諸表) - ML パッケージ
- FM1003 (米国の統一住宅ローン申請書) - ML パッケージ
- I9 (米国の就労資格証明書) - ML パッケージ
- ID Cards (ID カード) - ML パッケージ
- Invoices (請求書) - ML パッケージ
- InvoicesChina (請求書 - 中国) - ML パッケージ
- Invoices Hebrew (請求書 - ヘブライ語) - ML パッケージ
- InvoicesIndia (請求書 - インド) - ML パッケージ
- InvoicesJapan (請求書 - 日本) - ML パッケージ
- Invoices Shipping (船積送り状) - ML パッケージ
- Packing Lists (梱包明細書) - ML パッケージ
- Passports (パスポート) - ML パッケージ
- Payslips (給与明細) - ML パッケージ
- Purchase Orders (発注書) - ML パッケージ
- Receipts (領収書) - ML パッケージ
- RemittanceAdvices (送金通知書) - ML パッケージ
- UB-04 (健康保険請求フォーム) - ML パッケージ
- Utility Bills (公共料金の請求書) - ML パッケージ
- Vehicle Titles (自動車の権利書) - ML パッケージ
- W2 (米国の源泉徴収票) - ML パッケージ
- W9 (米国の納税申告書) - ML パッケージ
- その他のすぐに使える ML パッケージ
- パブリック エンドポイント
- ハードウェア要件
- パイプライン
- Document Manager
- OCR サービス
- サポートされている言語
- ディープ ラーニング
- Insights のダッシュボード
- Automation Suite にデプロイされた Document Understanding
- AI Center スタンドアロンにデプロイされた Document Understanding
- ライセンス
- Activities (アクティビティ)
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities

Document Understanding ガイド
Document Understanding アクティビティ
With DocumentUnderstanding.Activities, you can manage documents using a unified approach, by storing every information from the Document UnderstandingTM process within a Document Data object. Moreover, DocumentUnderstanding.Activities is integrated with Modern projects, enabling reusability.
既知の制限事項
UiPath は、DocumentUnderstanding.Activities パッケージの現在の制限事項を認識しており、近日中に解決する予定です。以下の機能はまだ利用できません。
- ドキュメントの分割のサポート。
- ビジネス ルール。
- モデルのトレーニング。
- オートメーションがデプロイされているテナント以外のモデルのサポート。
- Automation Suite のサポート。
1. ドキュメントの処理
ドキュメントを処理するには、PDF ファイルを抽出用に準備する必要があります。Document Understanding アクティビティを使用して、以下を実行できます。
- テキスト、画像、特定のページを抽出したり、複数の PDF を結合したりする。
- 暗号化された PDF ドキュメントのパスワードを変更する。
Document Understanding アクティビティで PDF ファイルを処理するには、以下のアクティビティを使用します。
| アクティビティ | 説明 |
|---|---|
| PDF のパスワードを設定 | 指定した PDF ファイルのパスワードを変更します。 |
| PDF を結合 | ファイル オブジェクトのコレクションを結合します。 |
| PDF のページ数を取得 | PDF ファイルの総ページ数を指定します。 |
| PDF のテキストを抽出 | PDF ドキュメントからテキストを抽出します。 |
| PDF の画像を抽出 | このアクティビティは、PDF ファイルで見つかるすべての画像を抽出します。 |
| PDF のページ範囲を抽出 | PDF ドキュメントの指定したページ範囲を抽出します。 |
2. データの抽出
Use the Extract Document Data activity to:
- Document Data オブジェクトとして保存された入力ファイルからデータを抽出する。
- 抽出結果を同じ Document Data オブジェクトに格納する。
Document Data is a resource that serves both as an input and output variable, within your Document Understanding workflows. The Document Data object holds all the necessary information about a single document. If you classify a document, the object includes the Document Type. If you extract data, the object contains the corresponding extracted fields. Irrespective of the activity, Document Data consistently contains the document's text and DOM (Document Object Model).
Provide the file as input only the first time you use Extract Document Data. The output, known as Document Data, should be reused throughout the workflow to prevent re-digitizing the same file, which costs 1 AI Unit per page.
Visit Document Data for more details.
3. データの分類
Use the Classify Document activity to:
- さまざまな分類モデルから選択する。
- 分類したデータを Document Data オブジェクトに出力する。
4. データを検証する
ドキュメント処理の検証手順では、処理されたドキュメントを送信して、Action Center 内でチームのメンバーとともに検証します。以下のアクティビティを使用して、Action Center でのドキュメント検証プロセスを構成することもできます。
| アクティビティ | 説明 |
|---|---|
| 検証タスクを作成 | 検証アクションを作成し、ワークフローが完了するまで検証を中断します。 |
| 検証タスク完了まで待機し再開 | 検証が完了するまでアクションを一時停止し、検証後に自動的に再開します。 |
| 検証タスクを作成して待機 | Action Center 内に抽出結果を視覚化および変更するためのアクションを作成し、アクションが完了するまでワークフローを一時停止します。 |
| 分類の検証タスクを作成 | 分類されたドキュメント データを確認するアクションを作成します。ただし、アクションが完了するまで待機しません。 |
| 分類の検証タスクを作成して待機 | 分類されたデータを確認するアクションを作成し、アクションが完了するまで待機してからワークフローを再開します。 |
| 分類の検証タスク完了まで待機し再開 | 分類の検証アクションが完了するまで待機してから、ワークフローを再開します。 |