- 概要
- 基本情報
- モデルを構築する
- モデルを使用する
- 詳細
- 1040 (米国の個人所得税申告書) - ML パッケージ
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ML パッケージ
- 1040 Schedule D (米国の個人所得税申告書のスケジュール D) - ML パッケージ
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ML パッケージ
- 1040x (米国の個人所得税修正申告書) - ML パッケージ
- 3949a - ML パッケージ
- 4506T (米国の納税申告証明依頼書) - ML パッケージ
- 709 (米国の贈与税申告書) - ML パッケージ
- 941x (米国の雇用主による四半期連邦税修正申告書) - ML パッケージ
- 9465 (米国の分割納付申請書) - ML パッケージ
- ACORD125 (企業向け保険契約申込書) - ML パッケージ
- ACORD126 (企業総合賠償責任保険) - ML パッケージ
- ACORD131 (アンブレラ/エクセス保険) - ML パッケージ
- ACORD140 (商業保険申込書の財物補償条項) - ML パッケージ
- ACORD25 (賠償責任保険証明書) - ML パッケージ
- Bank Statements (銀行預金残高証明書) - ML パッケージ
- BillsOfLading (船荷証券) - ML パッケージ
- Certificate of Incorporation (会社存在証明書) - ML パッケージ
- Certificate of Origin (原産地証明書) - ML パッケージ
- Checks (小切手) - ML パッケージ
- Children's Product Certificate (子供向け製品証明書) - ML パッケージ
- CMS 1500 (米国の医療保険請求フォーム) - ML パッケージ
- EU Declaration of Conformity (EU 適合宣言書) - ML パッケージ
- Financial Statements (財務諸表) - ML パッケージ
- FM1003 (米国の統一住宅ローン申請書) - ML パッケージ
- I9 (米国の就労資格証明書) - ML パッケージ
- ID Cards (ID カード) - ML パッケージ
- Invoices (請求書) - ML パッケージ
- InvoicesAustralia (請求書 - オーストラリア) - ML パッケージ
- InvoicesChina (請求書 - 中国) - ML パッケージ
- Invoices Hebrew (請求書 - ヘブライ語) - ML パッケージ
- InvoicesIndia (請求書 - インド) - ML パッケージ
- InvoicesJapan (請求書 - 日本) - ML パッケージ
- Invoices Shipping (船積送り状) - ML パッケージ
- Packing Lists (梱包明細書) - ML パッケージ
- Payslips (給与明細) - ML パッケージ
- Passports (パスポート) - ML パッケージ
- Purchase Orders (発注書) - ML パッケージ
- Receipts (領収書) - ML パッケージ
- RemittanceAdvices (送金通知書) - ML パッケージ
- UB-04 (健康保険請求フォーム) - ML パッケージ
- Utility Bills (公共料金の請求書) - ML パッケージ
- Vehicle Titles (自動車の権利書) - ML パッケージ
- W2 (米国の源泉徴収票) - ML パッケージ
- W9 (米国の納税申告書) - ML パッケージ
- パブリック エンドポイント
- サポートされている言語
- Insights のダッシュボード
- データおよびセキュリティ
- ライセンスと請求ロジック
- 使い方
Document Understanding モダン プロジェクト ユーザー ガイド
重要な概念
UiPath® Document UnderstandingTM の主要な概念について説明します。
アクティブ ラーニングは、Document UnderstandingTM のモデルを作成するための最新のアプローチです。
アクティブ ラーニングは、学習アルゴリズムがユーザーにクエリを実行して、目的の出力でデータにラベルを付けることができる対話型エクスペリエンスを提供します。このプロセスにより、機械学習モデルのトレーニングに必要な時間とデータを最大 80% 削減できます。AI はプロセスをガイドするために使用します。このプロセスには、一般に最も時間のかかるタスクである自動アノテーションが含まれます。このモデルは、最も有益なデータセットを使用して精度を高めるための専門家の推奨事項も提供します。
アクティブ ラーニングを使用すると、分析機能を使用して自動化を監視することもできます。
ドキュメントの種類とは、ドキュメントの内容、形式、目的などの識別要因に基づいた分類またはカテゴリのことです。たとえば、請求書、領収書、契約書、レポート、医療記録、法律文書です。
- 構造化: 特定の形式の情報を収集するように設計されたドキュメントです。たとえば、アンケート、納税申告書、パスポート、ライセンスはすべて構造化ドキュメントです。
- 半構造化: 厳密な形式に従わず、指定されたデータ フィールドに縛られないドキュメントです。半構造化ドキュメントには、請求書、領収書、公共料金の請求書、銀行預金残高証明書などがあります。
- 非構造化: 特定のモデルや整理されたモデルに従わないファイルのことです。たとえば、契約書、賃貸契約書、ニュース記事はすべて非構造化ドキュメントです。
ドキュメントの種類について詳しくは、「ドキュメントの種類」セクションをご覧ください。
ML モデルは、データから学習して予測や意思決定を行うようにトレーニングされた仮想アシスタントのようなものです。ML モデルは基本的に、学習することで過去のデータに基づいてパターンを認識するアルゴリズムです。与えるデータが多いほど、時間の経過とともに予測や意思決定を効果的に改善できます。
Document UnderstandingTM には、すぐに使える ML モデルがいくつか用意されています。これらのモデルを使用すると、半構造化ドキュメントや非構造化ドキュメントによく見られるデータ ポイントを分類して抽出できます。セットアップの必要はありません。
すぐに使えるモデルとフィールドの完全なリストについては、「すぐに使えるモデル」をご覧ください。
ML モデルは、OCR によってドキュメントとテキストが高い信頼度で認識される限り、大半の言語でトレーニングできます。
光学式文字認識 (OCR) は、スキャンした紙のドキュメント、PDF ファイル、デジタル カメラで撮影した画像などのさまざまな種類のドキュメントを、編集や検索が可能なデータに変換するために使用される特別なテクノロジです。
ほとんどの場合、OCR エンジンの精度は元のドキュメントの品質に依存します。通常は、書式が整っていて明瞭なテキストに読みやすいフォントが使われている場合に、最高の出力が生成されます。
UiPath® が提供する OCR エンジンのオプションでサポートされている言語について詳しくは、「OCR でサポートされている言語」をご覧ください。