- 概要
- 基本情報
- アクティビティ
- Insights のダッシュボード
- Document Understanding Process
- クイック スタート チュートリアル
- フレームワーク コンポーネント
- ML パッケージ
- 概要
- Document Understanding - ML パッケージ
- DocumentClassifier (ドキュメント分類) - ML パッケージ
- OCR 機能を持つ ML パッケージ
- 1040 (米国の個人所得税申告書) - ML パッケージ
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ML パッケージ
- 1040 Schedule D (米国の個人所得税申告書のスケジュール D) - ML パッケージ
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ML パッケージ
- 1040x (米国の個人所得税修正申告書) - ML パッケージ
- 3949a - ML パッケージ
- 4506T (米国の納税申告証明依頼書) - ML パッケージ
- 709 (米国の贈与税申告書) - ML パッケージ
- 941x (米国の雇用主による四半期連邦税修正申告書) - ML パッケージ
- 9465 (米国の分割納付申請書) - ML パッケージ
- ACORD131 (アンブレラ/エクセス保険) - ML パッケージ
- ACORD140 (商業保険申込書の財物補償条項) - ML パッケージ
- ACORD25 (賠償責任保険証明書) - ML パッケージ
- Bank Statements (銀行預金残高証明書) - ML パッケージ
- BillsOfLading (船荷証券) - ML パッケージ
- Certificate of Incorporation (会社存在証明書) - ML パッケージ
- Certificate of Origin (原産地証明書) - ML パッケージ
- Checks (小切手) - ML パッケージ
- Children's Product Certificate (子供向け製品証明書) - ML パッケージ
- CMS 1500 (米国の医療保険請求フォーム) - ML パッケージ
- EU Declaration of Conformity (EU 適合宣言書) - ML パッケージ
- Financial Statements (財務諸表) - ML パッケージ
- FM1003 (米国の統一住宅ローン申請書) - ML パッケージ
- I9 (米国の就労資格証明書) - ML パッケージ
- ID Cards (ID カード) - ML パッケージ
- Invoices (請求書) - ML パッケージ
- InvoicesAustralia (請求書 - オーストラリア) - ML パッケージ
- InvoicesChina (請求書 - 中国) - ML パッケージ
- Invoices Hebrew (請求書 - ヘブライ語) - ML パッケージ
- InvoicesIndia (請求書 - インド) - ML パッケージ
- InvoicesJapan (請求書 - 日本) - ML パッケージ
- Invoices Shipping (船積送り状) - ML パッケージ
- Packing Lists (梱包明細書) - ML パッケージ
- Payslips (給与明細) - ML パッケージ
- Passports (パスポート) - ML パッケージ
- Purchase Orders (発注書) - ML パッケージ
- Receipts (領収書) - ML パッケージ
- RemittanceAdvices (送金通知書) - ML パッケージ
- UB-04 (健康保険請求フォーム) - ML パッケージ
- Utility Bills (公共料金の請求書) - ML パッケージ
- Vehicle Titles (自動車の権利書) - ML パッケージ
- W2 (米国の源泉徴収票) - ML パッケージ
- W9 (米国の納税申告書) - ML パッケージ
- その他のすぐに使える ML パッケージ
- パブリック エンドポイント
- トラフィック制限
- OCR の設定
- パイプライン
- OCR サービス
- サポートされている言語
- ディープ ラーニング
- ライセンス
はじめに
The UiPath® Document UnderstandingTM framework facilitates the processing of incoming files, from file digitization to extracted data validation, all in an open, extensible, and versatile environment.
Document Understanding は、様々なドキュメントの種類から情報を抽出するために、異なるアプローチを組み合わることができるよう設計されています。さまざまなドキュメントからデータを抽出する単一のワークフローを作成することで、データ抽出プロセスをできるだけシンプルにします。
Document Understanding フレームワークを使用する前に、以下の Document Understanding フレームワーク コンポーネントを理解しておくことをお勧めします。
- タクソノミー 処理するドキュメントと抽出するデータを定義ドキュメントの種類と、データ抽出の対象となる情報の断片 (フィールド) を定義し、情報を専用のタクソノミー構造に形式化します。このメタデータ情報は、タクソノミー マネージャーで管理されます。
- デジタル化 ファイルのコンテンツを取得受け取るドキュメントのテキスト コンテンツと構造を取得し、ファイルを機械判読可能なコンテンツに変換して、下流でさらに処理できるようにするために使用します。
- ドキュメント分類 ファイル内のドキュメントの種類を特定 デジタル化されたファイルに含まれるドキュメントの種類を自動的に特定するために使用します。
- ドキュメント分類の検証 予想した分類が正しいか確認 (人間によるレビューおよび修正)自動分類およびドキュメント分割の結果の人間による検証および修正をサポートするために使用します。
- 分類トレーニング 人間のレビュー結果のロボットへのフィードバック人間が検証した情報を分類器に返し、それを使用して今後の予測を改善するために使用します。
- データ抽出 ドキュメント内のデータの識別特定の入力ドキュメントおよび分類ページ範囲内で、識別されたドキュメントの種類で必要とされる情報をキャプチャするために使用します。
- データ抽出の検証 抽出された情報が正しいか確認 (人間によるレビューおよび修正) 自動的に抽出されたデータ結果の、人間による検証および修正をサポートするために使用します。
- データ抽出トレーニング 人間のレビュー結果のロボットへのフィードバック人間が検証した抽出データを抽出器に返し、それを使用して抽出予測を改善するために使用します。
- データ消費: 検証済みデータをエクスポートして消費するために使用します。
- 使用状況の測定と請求ロジック: 利用可能な各サービスのページあたりの消費単位の説明に使用します。
以下の図は、Document Understanding フレームワークのコンポーネント間の関連を示しています。
Document Understanding フレームワークは、UiPath.IntelligentOCR.Activities パッケージに含まれています。UiPath.IntelligentOCR.Activities パッケージをインストールすると、UiPath Studio の最上部のリボンに [タクソノミー マネージャー] ウィザードが表示されます。このパッケージには、Document Understanding フレームワークの主要なアクティビティがすべて含まれています。
Document Understanding フレームワークの一部であるスコープ アクティビティ ([ドキュメント分類スコープ]、[データ抽出スコープ]、[分類器トレーニング スコープ]、[抽出器トレーニング スコープ]) を使用することで、ユース ケースに合わせてドキュメントの分類とデータ抽出のアルゴリズムを使用し、これらのアルゴリズムをトレーニングできます。
Document Understanding フレームワークは、すぐに使える分類器や抽出器だけでなく、カスタム作成された分類器や抽出器でも使用できます。UiPath.DocumentProcessing.Contracts パッケージの抽象クラスを使用して作成でき、「分類」系または「データ抽出」系のアクティビティとして実装できます。UiPath.OCR.Contracts パッケージの抽象クラスを使用して、カスタム作成の OCR エンジンを作成することもできます。
UiPath RPA アカデミーには、Document Understanding 専門のコースがあります。
UiPath コミュニティ フォーラムは、UiPath の成長著しいユーザー コミュニティから支援を受けられるフォーラムです。