- 概要
- 基本情報
- アクティビティ
- Insights のダッシュボード
- Document Understanding Process
- クイック スタート チュートリアル
- フレームワーク コンポーネント
- ML パッケージ
- 概要
- Document Understanding - ML パッケージ
- DocumentClassifier (ドキュメント分類) - ML パッケージ
- OCR 機能を持つ ML パッケージ
- 1040 (米国の個人所得税申告書) - ML パッケージ
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ML パッケージ
- 1040 Schedule D (米国の個人所得税申告書のスケジュール D) - ML パッケージ
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ML パッケージ
- 1040x (米国の個人所得税修正申告書) - ML パッケージ
- 3949a - ML パッケージ
- 4506T (米国の納税申告証明依頼書) - ML パッケージ
- 709 (米国の贈与税申告書) - ML パッケージ
- 941x (米国の雇用主による四半期連邦税修正申告書) - ML パッケージ
- 9465 (米国の分割納付申請書) - ML パッケージ
- ACORD131 (アンブレラ/エクセス保険) - ML パッケージ
- ACORD140 (商業保険申込書の財物補償条項) - ML パッケージ
- ACORD25 (賠償責任保険証明書) - ML パッケージ
- Bank Statements (銀行預金残高証明書) - ML パッケージ
- BillsOfLading (船荷証券) - ML パッケージ
- Certificate of Incorporation (会社存在証明書) - ML パッケージ
- Certificate of Origin (原産地証明書) - ML パッケージ
- Checks (小切手) - ML パッケージ
- Children's Product Certificate (子供向け製品証明書) - ML パッケージ
- CMS 1500 (米国の医療保険請求フォーム) - ML パッケージ
- EU Declaration of Conformity (EU 適合宣言書) - ML パッケージ
- Financial Statements (財務諸表) - ML パッケージ
- FM1003 (米国の統一住宅ローン申請書) - ML パッケージ
- I9 (米国の就労資格証明書) - ML パッケージ
- ID Cards (ID カード) - ML パッケージ
- Invoices (請求書) - ML パッケージ
- InvoicesAustralia (請求書 - オーストラリア) - ML パッケージ
- InvoicesChina (請求書 - 中国) - ML パッケージ
- Invoices Hebrew (請求書 - ヘブライ語) - ML パッケージ
- InvoicesIndia (請求書 - インド) - ML パッケージ
- InvoicesJapan (請求書 - 日本) - ML パッケージ
- Invoices Shipping (船積送り状) - ML パッケージ
- Packing Lists (梱包明細書) - ML パッケージ
- Payslips (給与明細) - ML パッケージ
- Passports (パスポート) - ML パッケージ
- Purchase Orders (発注書) - ML パッケージ
- Receipts (領収書) - ML パッケージ
- RemittanceAdvices (送金通知書) - ML パッケージ
- UB-04 (健康保険請求フォーム) - ML パッケージ
- Utility Bills (公共料金の請求書) - ML パッケージ
- Vehicle Titles (自動車の権利書) - ML パッケージ
- W2 (米国の源泉徴収票) - ML パッケージ
- W9 (米国の納税申告書) - ML パッケージ
- その他のすぐに使える ML パッケージ
- パブリック エンドポイント
- トラフィック制限
- OCR の設定
- パイプライン
- OCR サービス
- サポートされている言語
- ディープ ラーニング
- ライセンス
Document Understanding ガイド
ドキュメント分類の概要
ドキュメント分類は、ロボットが処理しているファイルの種類を識別するのに役立つ Document UnderstandingTM フレームワークのコンポーネントです。
ファイルは、内容や使用される分類方法に応じて、1 つ以上のドキュメントの種類に分類できます。
- ファイルに 1 つの種類の論理ドキュメントが含まれる場合 (たとえば、それ全体が 1 つの請求書または医療記録の場合)、それに応じて分類コンポーネントが設定され、1 つの分類結果が返されます。
- ファイルに複数の種類の論理ドキュメントが含まれる場合 (たとえば、1 ~ 5 ページには請求書、次の 10 ページには医療記録、16 ページから最後までは保険契約書が含まれる場合)、分類コンポーネントは、それぞれが入力ファイルの正しいページ範囲に対応する複数の分類結果を返します。
分類が試行されるドキュメントの種類は、プロジェクトのタクソノミーで定義された種類です。
プロジェクトで、すべてが同じドキュメントの種類で、常にファイルごとに 1 つのインスタンスとして存在するファイル (たとえば、1 つのファイルに 1 つの請求書) を処理する必要がある場合、分類は不要で、分類自体をスキップできます。
一方、プロジェクトで、2 つ以上の種類のドキュメントを処理している場合 (たとえば、処理前には区別できない請求書と医療記録をワークフローで処理する必要がある場合)、またはファイル内に 2 つ以上の異なる種類のドキュメントが含まれることがある場合 (たとえば、1 つのファイルに 3 つの請求書)、分類を行うことを強くお勧めします。
分類は、[ドキュメント分類スコープ] アクティビティを使用して行われます。このスコープ アクティビティには、ドキュメント分類のための 1 つ以上のアルゴリズムを設定して実行する役割と、ユーザーのニーズに合わせた 1 つのシンプルな設定オプションを提供する役割があるため、1 つ以上の分類器を使用してドキュメントを分類することができます。
[ドキュメント分類スコープ] で行われることを、以下に簡潔にまとめます。
- すべての分類器 (分類アルゴリズム) の実行に必要な設定を指定します。
- 1 つ以上の分類器を受け入れます。
- 分類器レベルでのドキュメントの種類のフィルター処理、タクソノミーのマッピング、および最小信頼度閾値の設定を可能にします。
- 分類のソースに関係なく、分類情報を統一された方法で報告します。
[ドキュメント分類スコープ] は、分類器を設定ウィザードを使用して設定できます。以下をカスタマイズできます。
- どの分類器からどのドキュメントの種類が受け入れられるか
- 分類器ごとに許容される、特定の結果の最小信頼度閾値
- ドキュメントの種類のレベルでの、プロジェクトのタクソノミーと分類器の内部タクソノミー間のマッピング (ある場合)
[ドキュメント分類スコープ] での分類器の順序は重要です。
- 分類器は、左から優先的に実行されます。
- 分類器から返された分類結果は、それが許容できるドキュメントの種類のいずれかについての報告であり、かつその分類器に設定された信頼度閾値が最小信頼度閾値以上である場合に受け入れられます。
- 分類器は、前の分類器だけでは分類されずに残ったページ範囲で実行されます (このため、1 つの実行で複数回呼び出されることがあります)。
ユース ケースの要件に基づいて、分類器と呼ばれる複数の分類方法から選択できます。
分類器は UiPath.IntelligentOCR.Activities または UiPath.DocumentUnderstanding.ML.Activities のパッケージに含まれています。
使用可能な分類器は次のとおりです。
公開されている Document Processing Contracts を使用していつでも独自の分類器を構築し、ユース ケースに適したアルゴリズムを実装できます。