- 概要
- 基本情報
- モデルを構築する
- はじめに
- プロジェクトを作成する
- ドキュメントをインポートする
- 開発
- Measure
- 公開
- モダン プロジェクトを移行する
- 監視
- UiPath® DocPath (英語)
- 既知の制限事項
- モデルを使用する
- 詳細
- 1040 (米国の個人所得税申告書) - ML パッケージ
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ML パッケージ
- 1040 Schedule D (米国の個人所得税申告書のスケジュール D) - ML パッケージ
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ML パッケージ
- 1040x (米国の個人所得税修正申告書) - ML パッケージ
- 3949a - ML パッケージ
- 4506T (米国の納税申告証明依頼書) - ML パッケージ
- 709 (米国の贈与税申告書) - ML パッケージ
- 941x (米国の雇用主による四半期連邦税修正申告書) - ML パッケージ
- 9465 (米国の分割納付申請書) - ML パッケージ
- ACORD125 (企業向け保険契約申込書) - ML パッケージ
- ACORD126 (企業総合賠償責任保険) - ML パッケージ
- ACORD131 (アンブレラ/エクセス保険) - ML パッケージ
- ACORD140 (商業保険申込書の財物補償条項) - ML パッケージ
- ACORD25 (賠償責任保険証明書) - ML パッケージ
- Bank Statements (銀行預金残高証明書) - ML パッケージ
- BillsOfLading (船荷証券) - ML パッケージ
- Certificate of Incorporation (会社存在証明書) - ML パッケージ
- Certificate of Origin (原産地証明書) - ML パッケージ
- Checks (小切手) - ML パッケージ
- Children's Product Certificate (子供向け製品証明書) - ML パッケージ
- CMS 1500 (米国の医療保険請求フォーム) - ML パッケージ
- EU Declaration of Conformity (EU 適合宣言書) - ML パッケージ
- Financial Statements (財務諸表) - ML パッケージ
- FM1003 (米国の統一住宅ローン申請書) - ML パッケージ
- I9 (米国の就労資格証明書) - ML パッケージ
- ID Cards (ID カード) - ML パッケージ
- Invoices (請求書) - ML パッケージ
- InvoicesAustralia (請求書 - オーストラリア) - ML パッケージ
- InvoicesChina (請求書 - 中国) - ML パッケージ
- Invoices Hebrew (請求書 - ヘブライ語) - ML パッケージ
- InvoicesIndia (請求書 - インド) - ML パッケージ
- InvoicesJapan (請求書 - 日本) - ML パッケージ
- Invoices Shipping (船積送り状) - ML パッケージ
- Packing Lists (梱包明細書) - ML パッケージ
- Payslips (給与明細) - ML パッケージ
- Passports (パスポート) - ML パッケージ
- Purchase Orders (発注書) - ML パッケージ
- Receipts (領収書) - ML パッケージ
- RemittanceAdvices (送金通知書) - ML パッケージ
- UB-04 (健康保険請求フォーム) - ML パッケージ
- Utility Bills (公共料金の請求書) - ML パッケージ
- Vehicle Titles (自動車の権利書) - ML パッケージ
- W2 (米国の源泉徴収票) - ML パッケージ
- W9 (米国の納税申告書) - ML パッケージ
- パブリック エンドポイント
- サポートされている言語
- Insights のダッシュボード
- データおよびセキュリティ
- ライセンスと請求ロジック
- 使い方
UiPath® DocPath (英語)
DocPath 大規模言語モデル (LLM) は、UiPath の最新のデータ抽出モデル テクノロジです。 UiPath® Document UnderstandingTM で使用されている現行世代のモデルを置き換えるように設計されています。 DocPath の動作は以前のモデルと似ていますが、さまざまなドキュメントを使用してトレーニングされています。 これにより、一般的なドキュメントの種類をほとんどまたはまったくトレーニングせずに処理できます。 DocPath LLM を際立たせているのは、その生成アーキテクチャです。これにより、精度が大幅に向上し、抽出が簡素化されます。 さらに、独自のデータセットでモデルを微調整することもできます。
DocPath のアーキテクチャとトレーニングに使用される手法の詳細については、AI ブログの「 DocPath 」をご覧ください。
DocPath LLM では、以前のモデルに比べてさまざまな機能が強化されています。 これにより、特に表の精度が向上し、さまざまなドキュメント レイアウトに適応して注釈の労力が軽減され、自動化率が向上します。
- 精度の向上: DocPath LLM は、請求書、領収書、発注書などの半構造化ドキュメントの精度が高く、F1 スコアも高くなります。 これにより、正確で一貫性のあるデータ抽出が保証されます。
- 簡単なアノテーション: このモデルでは、1 つのドキュメントにつき 1 つのアノテーションで済み、すべてのページのフィールド インスタンスにアノテーションを行う必要がなくなるため、手作業が軽減されます。
- 自動化の強化: 信頼度レベルと精度の相関性が高いため、DocPath LLM は自動化率を向上させると同時に、同じ精度レベルで Action Center に送信されるドキュメントの数を減らします。
社内テストの結果、DocPath は前モデルよりも優れたパフォーマンスを発揮していました。 偽陽性率は約15%減少し、偽陰性率は約17%低下しました。
DocPath LLM は、Document Understanding モダン プロジェクトでのみ使用できます。 DocPath の導入後も、既存のすべてのプロジェクト バージョンは、現在のモデル バージョンを使用します。 これにより、進行中の運用ワークフローを中断することなく、シームレスに移行できます。
DocPath で既存のドキュメントの種類のトレーニングを開始するには、いくつかのドキュメントのすべてのフィールドの確認を解除してから確認します。
選択するフィールド名は、モデルのパフォーマンスに大きく影響します。 最適な結果が得られるように、フィールド名には自然言語と適切な文法を使用してください。 Number (No)、Account (Acct)、Address (Addr)、Apartment (Apt) など、広く認識されている頭字語のみを使用してください。 現在、西ヨーロッパの言語のみがサポートされているため、選択したフィールド名がこれらの言語と一致していることを確認してください。 "列 3" などの説明的でない名前は、ドキュメントでその用語が特に使用されている場合を除き、使用しないでください。