- 概要
- Document Understanding Process
- クイック スタート チュートリアル
- フレームワーク コンポーネント
- ML パッケージ
- 概要
- Document Understanding - ML パッケージ
- DocumentClassifier (ドキュメント分類) - ML パッケージ
- OCR 機能を持つ ML パッケージ
- 1040 (米国の個人所得税申告書) - ML パッケージ
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ML パッケージ
- 1040 Schedule D (米国の個人所得税申告書のスケジュール D) - ML パッケージ
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ML パッケージ
- 1040x (米国の個人所得税修正申告書) - ML パッケージ
- 3949a - ML パッケージ
- 4506T (米国の納税申告証明依頼書) - ML パッケージ
- 709 (米国の贈与税申告書) - ML パッケージ
- 941x (米国の雇用主による四半期連邦税修正申告書) - ML パッケージ
- 9465 (米国の分割納付申請書) - ML パッケージ
- 990 (米国の所得税非課税団体申告書) - ML パッケージ (プレビュー)
- ACORD125 (企業向け保険契約申込書) - ML パッケージ
- ACORD126 (企業総合賠償責任保険) - ML パッケージ
- ACORD131 (アンブレラ/エクセス保険) - ML パッケージ
- ACORD140 (商業保険申込書の財物補償条項) - ML パッケージ
- ACORD25 (賠償責任保険証明書) - ML パッケージ
- Bank Statements (銀行預金残高証明書) - ML パッケージ
- BillsOfLading (船荷証券) - ML パッケージ
- Certificate of Incorporation (会社存在証明書) - ML パッケージ
- Certificate of Origin (原産地証明書) - ML パッケージ
- Checks (小切手) - ML パッケージ
- Children's Product Certificate (子供向け製品証明書) - ML パッケージ
- CMS 1500 (米国の医療保険請求フォーム) - ML パッケージ
- EU Declaration of Conformity (EU 適合宣言書) - ML パッケージ
- Financial Statements (財務諸表) - ML パッケージ
- FM1003 (米国の統一住宅ローン申請書) - ML パッケージ
- I9 (米国の就労資格証明書) - ML パッケージ
- ID Cards (ID カード) - ML パッケージ
- Invoices (請求書) - ML パッケージ
- InvoicesChina (請求書 - 中国) - ML パッケージ
- Invoices Hebrew (請求書 - ヘブライ語) - ML パッケージ
- InvoicesIndia (請求書 - インド) - ML パッケージ
- InvoicesJapan (請求書 - 日本) - ML パッケージ
- Invoices Shipping (船積送り状) - ML パッケージ
- Packing Lists (梱包明細書) - ML パッケージ
- Passports (パスポート) - ML パッケージ
- Payslips (給与明細) - ML パッケージ
- Purchase Orders (発注書) - ML パッケージ
- Receipts (領収書) - ML パッケージ
- RemittanceAdvices (送金通知書) - ML パッケージ
- UB-04 (健康保険請求フォーム) - ML パッケージ
- Utility Bills (公共料金の請求書) - ML パッケージ
- Vehicle Titles (自動車の権利書) - ML パッケージ
- W2 (米国の源泉徴収票) - ML パッケージ
- W9 (米国の納税申告書) - ML パッケージ
- その他のすぐに使える ML パッケージ
- パブリック エンドポイント
- ハードウェア要件
- パイプライン
- Document Manager
- OCR サービス
- サポートされている言語
- ディープ ラーニング
- Insights のダッシュボード
- Automation Suite にデプロイされた Document Understanding
- AI Center スタンドアロンにデプロイされた Document Understanding
- ライセンス
- Activities (アクティビティ)
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities

Document Understanding ガイド
ドキュメントをインポートする
[データをインポート] ダイアログ ボックスを使用すると、ラベル付けするまたは変更する新しいドキュメントを簡単にインポートできます。
Select the Import button
from the management bar.
ダイアログ ボックスには、次のコントロールが含まれます。
-
[バッチ名] テキスト フィールド - エクスポート名の入力は必須です。入力しないと、[ファイルを参照またはドロップ] セクションが無効化されて表示されます。有効な名前は最大 24 文字で、特殊文字を含めることはできません。
-
[これを評価セットにする] チェックボックス - オンにすると、そのデータセットは評価目的で使用されます。
-
Browse or drop files section - select Browse files to upload to navigate through your directory or simply drag and drop the files inside the frame.
-
Status section - select (load previous import log) to check to check the status of the latest import; when uploading data, in the Status section you receive an overview of your files and you are prompted to proceed with the import by selecting YES or abort the import by selecting CANCEL.
![[データをインポート] インターフェイスのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-of-the-import-data-interface-116559-ad0afa2c-bf53c797.webp)
インポートの種類
Document Manager でサポートされているインポートは次の 4 種類です。
- スキーマのインポート
- Raw documents import (max 2000 pages and 4000 MiB per import)
- Document Manager dataset import (4000 MiB per import)
- Validation Station dataset import (max 2000 pages and 4000 MiB per import)
スキーマのインポート
既存のセッションと同じスキーマを使用して新しい Document Manager セッションを起動する場合は、次の手順を実行します。
- Select the Export button from the management bar.
- [ファイルをエクスポート] ダイアログ ボックスで、[スキーマ] オプションのチェックボックスをオンにします。
- Select the Export button inside the dialog box. A
.zipfile is exported. - Select the Import button from the management bar.
- Upload or drag & drop the
.zipfile directly into the new Document Manager session (do not unzip). In this step, you can also upload a predefined schema. - Select YES in the Status section to proceed with the import. The schema is imported.
スキーマのインポートは複数値フィールドにも対応します。
複数値フィールドは v2022.10 以降のモデルにのみ対応している点にご留意ください。
未加工ドキュメントのインポート
ラベル付け用にインポートできるドキュメントの種類は .pdf、.tiff、.png、.jpg です。
.zip ファイルは、未加工ドキュメントのインポートではサポートされていません。
インポートを行う前に OCR の設定を行う必要があります。
- Select the Import button
. The Import data dialog box is displayed. - [バッチ名] フィールドにバッチ名を入力します。これにより、後から [検索] ドロップダウンを使用して、これらのドキュメントを簡単にフィルター処理して見つけることができます。
- このドキュメント バッチを ML モデルのトレーニングに使用する場合は、[これを評価セットにする] チェックボックスをオフのままにします。
- このドキュメント バッチを ML モデルの評価 (例: パフォーマンスの測定) に使用する場合は、[これを評価セットにする] チェックボックスをオンにします。これにより、データがトレーニング パイプラインにより無視されるようになります。
- [ファイルを参照またはドロップ] セクションに、1 つのファイルまたはファイルのセットをアップロードするか、ドラッグ アンド ドロップします。
- Select YES. The file or set of files are imported.
Document Manager のデータセットのインポート
別の Document Manager セッションで以前にラベル付けされたデータセットをインポートするには、最初にエクスポートされた .zip ファイルを取得し、新しい Document Manager インスタンスに直接インポートする必要があります。
新しい Document Manager インスタンスが完全に空の場合 (データがなく、フィールドが定義されていない)、ラベル付けされたドキュメントとスキーマの両方がインポートされます。
新しい Data Manager インスタンスで既にフィールドが定義されている場合は、新しくインポートするデータセットにも同じフィールドか、それらのフィールドのサブセットが含まれている必要があります。そうでない場合、インポートは拒否されます。
Automation Cloud™ 環境からデータベースをエクスポートした後、オンプレミスのデプロイにインポートする場合は、以下の手順を実行する必要があります。
- データセット ファイルを展開します。
- アーカイブの
scheman.jsonファイルを編集します。 jsonファイルからすべてのdisplay_nameプロパティを削除し、保存します。- データセットを圧縮し、オンプレミス セッションにインポートします。
サイズの大きいデータセットを分割する
To import Document Manager datasets larger than 1GB or that have more than 1500 files, we recommend you to use this script which splits the .zip files into multiple .zip files that are smaller than 1GB and that have less than 1500 files.
検証ステーションのデータセットのインポート
As your RPA workflow processes documents using an existing ML model, some documents may require human validation using the Validation Station activity (available on attended bots or in the browser using Orchestrator Action Center).
The validated data generated in Validation Station can be exported using Machine Learning Extractor Trainer activity and can be used to train ML models.
検証ステーションのデータセットのインポートでは、スキーマを定義する必要があります。
- [マシン ラーニング抽出器トレーナー] アクティビティのデータの出力先を
<Trainer/Output/Folder>というパス (任意の空のフォルダー パスを使用) のフォルダーに設定します。 - [検証ステーションを提示] アクティビティと [マシン ラーニング抽出器トレーナー] アクティビティを含む RPA ワークフローを実行します。
- [マシン ラーニング抽出器トレーナー] アクティビティは、出力フォルダー内にドキュメント、メタデータ、予測の 3 つのサブフォルダーを作成します。
<Trainer/Output/Folder>を圧縮して、.zipファイルを取得します (例: TrainerOutputFolder.zip)。.zipファイルを Document Manager にインポートします。Document Manager は、インポートされたファイルに [マシン ラーニング抽出器トレーナー] アクティビティによって作成されたデータが含まれていることを検出し、それに応じてデータをインポートします。
データセットで必要なフィールドが見つからない場合は、インポート ダイアログ ボックスにエラー メッセージが表示されます。
![[データをインポート] インターフェイスのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-of-the-import-data-interface-118101-61ffccf2-8da1f8f1.webp)