- 概要
- 基本情報
- モデルを構築する
- モデルを使用する
- 詳細
- パブリック エンドポイント
- 1040 (米国の個人所得税修正申告書) - ドキュメントの種類
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ドキュメントの種類
- (米国の個人所得税申告書のスケジュール D) - ドキュメントの種類
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ドキュメントの種類
- 1040x (米国の個人所得税修正申告書) - ドキュメントの種類
- 3949a (米国の課税・徴収漏れに関する情報提供フォーム) - ドキュメントの種類
- 4506T (米国の納税申告証明依頼書) - ドキュメントの種類
- 709 (米国の贈与税申告書) - ドキュメントの種類
- 941× (米国の雇用主による四半期連邦税修正申告書) - ドキュメントの種類
- 9465 (米国の分割納付申請書) - ドキュメントの種類
- ACORD125 (企業向け保険契約申込書) - ドキュメントの種類
- ACORD126 (企業総合賠償責任保険) - ドキュメントの種類
- ACORD131 (アンブレラ/エクセス保険) - ドキュメントの種類
- ACORD140 (商業保険申込書の財物補償条項) - ドキュメントの種類
- ACORD25 (賠償責任保険証明書) - ドキュメントの種類
- Bank Statements (銀行預金残高証明書) - ドキュメントの種類
- BillsOfLading (船荷証券) - ドキュメントの種類
- Certificate of Incorporation (会社存在証明書) - ドキュメントの種類
- Certificate of Origin (原産地証明書) - ドキュメントの種類
- Checks (小切手) - ドキュメントの種類
- Children's Product Certificate (子供向け製品証明書) - ドキュメントの種類
- CMS 1500 (米国の医療保険請求フォーム) - ドキュメントの種類
- EU Declaration of Conformity (EU 適合宣言書) - ドキュメントの種類
- Financial Statements (財務諸表) - ドキュメントの種類
- FM1003 (米国の統一住宅ローン申請書) - ドキュメントの種類
- I9 (米国の就労資格証明書) - ドキュメントの種類
- ID Cards (ID カード) - ドキュメントの種類
- Invoices (請求書) - ドキュメントの種類
- Invoices2 (請求書 2) - ドキュメントの種類
- InvoicesAustralia (請求書 - オーストラリア) - ドキュメントの種類
- Invoices China (請求書 - 中国) - ドキュメントの種類
- Invoices Hebrew (請求書 - ヘブライ語) - ドキュメントの種類
- Invoices India (請求書 - インド) - ドキュメントの種類
- Invoices Japan (請求書 - 日本) - ドキュメントの種類
- Invoices Shipping (船積送り状) - ドキュメントの種類
- Packing Lists (梱包明細書) - ドキュメントの種類
- Pay slips (給与明細) - ドキュメントの種類
- Passports (パスポート) - ドキュメントの種類
- Purchase Orders (発注書) - ドキュメントの種類
- Receipts (領収書) - ドキュメントの種類
- Receipts2 (領収書 2) - ドキュメントの種類
- Receipts Japan (領収書 - 日本) - ドキュメントの種類
- Remittance Advices (送金通知書) - ドキュメントの種類
- UB-04 (健康保険請求フォーム) - ドキュメントの種類
- US Mortgage Closing Disclosures (米国のローン契約締結開示説明書) - ドキュメントの種類
- Utility Bills (公共料金の請求書) - ドキュメントの種類
- Vehicle Titles (自動車の権利書) - ドキュメントの種類
- W2 (米国の源泉徴収票) - ドキュメントの種類
- W9 (米国の納税申告書) - ドキュメントの種類
- サポートされている言語
- データおよびセキュリティ
- ライセンスと請求ロジック
- 使い方
- トラブルシューティング

Automation Cloud (専有型) の Document Understanding ユーザー ガイド
チェックボックスと署名
linkチェックボックスと署名は、契約上の合意から登録フォームまで、さまざまな種類のドキュメントで重要な役割を果たす 2 つの要素です。モデルを最大限に活用するには、チェックボックスと署名に正しくアノテーションを行う方法を理解することが重要です。
チェックボックス
link- 相互に排他的なチェックボックス
- 相互に排他的ではないチェックボックス (複数のオプションを選択可能)
考慮すべき重要な点は、特定の複数選択フィールドで提供されている選択肢の数です。オプションが 1 個だけで、チェックボックスがオンかオフのいずれかしかない場合もありますが、多くの場合は、健康診断書のように、オプションが 10 個から 20 個、あるいはそれ以上あり、グリッドや表の形式で構成されていることがほとんどです。
このような多様な複数選択フィールドにアノテーションを行うという観点では、主に 2 つの方法を使用できます。
オプションにアノテーションを行う
例を見ながら、オプションにアノテーションを行う方法を理解していきましょう。
このアプローチのメリットは、フィールドが 1 つあれば良く、必要なデータが少ないところです。また、チェックボックスの検出の成否に依存することもありません。たとえば、チェックボックスが誤って X という文字として検出されても、モデルはその X の意味が、その横にあるオプションがオンになっていることだと学習して認識できます。
潜在的なデメリットとしては、両方のオプションがだいたい等しく表されていることを確認する必要があります。常にそうなっているとは限りません。たとえば、データセット内のドキュメントの 90% で 2018 にチェックマークが付いている場合、モデルのパフォーマンスが影響を受け、このアプローチは失敗する可能性があります。オプションが多いほど問題は悪化します。一部のオプションはほとんどの場合、まれであるためです。このような場合には、まれなオプションにチェックマークを付けた偽のドキュメントを作成して、バランスを取る必要があるかもしれません。
単一の複数値フィールドを持つオプションにアノテーションを行う
この方法でも、アノテーション プロセスが簡素化され、チェックボックス検出エラーの影響を受けにくくなります。ただし、バランスの悪いオプションの影響を受けやすくなる可能性があります。
署名の検出
linkUiPath Document OCR を使用して署名を識別し、ML モデルで署名を直接検出できます。
ドキュメント内の他のフィールドと同じように署名にアノテーションを行います。UiPath Document OCR によって署名が識別されると、ML モデルはこのフィールドを署名として認識するよう学習します。
推論時に、署名はドキュメントに表示されているとおりに取得されます。RPA ロジックを使用して、これを Boolean フィールド (Yes/No) に変換する必要があります。