- 概要
- 基本情報
- アクティビティ
- Insights のダッシュボード
- Document Understanding Process
- クイック スタート チュートリアル
- フレームワーク コンポーネント
- ML パッケージ
- 概要
- Document Understanding - ML パッケージ
- DocumentClassifier (ドキュメント分類) - ML パッケージ
- OCR 機能を持つ ML パッケージ
- 1040 (米国の個人所得税申告書) - ML パッケージ
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ML パッケージ
- 1040 Schedule D (米国の個人所得税申告書のスケジュール D) - ML パッケージ
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ML パッケージ
- 1040x (米国の個人所得税修正申告書) - ML パッケージ
- 3949a - ML パッケージ
- 4506T (米国の納税申告証明依頼書) - ML パッケージ
- 709 (米国の贈与税申告書) - ML パッケージ
- 941x (米国の雇用主による四半期連邦税修正申告書) - ML パッケージ
- 9465 (米国の分割納付申請書) - ML パッケージ
- ACORD131 (アンブレラ/エクセス保険) - ML パッケージ
- ACORD140 (商業保険申込書の財物補償条項) - ML パッケージ
- ACORD25 (賠償責任保険証明書) - ML パッケージ
- Bank Statements (銀行預金残高証明書) - ML パッケージ
- BillsOfLading (船荷証券) - ML パッケージ
- Certificate of Incorporation (会社存在証明書) - ML パッケージ
- Certificate of Origin (原産地証明書) - ML パッケージ
- Checks (小切手) - ML パッケージ
- Children's Product Certificate (子供向け製品証明書) - ML パッケージ
- CMS 1500 (米国の医療保険請求フォーム) - ML パッケージ
- EU Declaration of Conformity (EU 適合宣言書) - ML パッケージ
- Financial Statements (財務諸表) - ML パッケージ
- FM1003 (米国の統一住宅ローン申請書) - ML パッケージ
- I9 (米国の就労資格証明書) - ML パッケージ
- ID Cards (ID カード) - ML パッケージ
- Invoices (請求書) - ML パッケージ
- InvoicesAustralia (請求書 - オーストラリア) - ML パッケージ
- InvoicesChina (請求書 - 中国) - ML パッケージ
- Invoices Hebrew (請求書 - ヘブライ語) - ML パッケージ
- InvoicesIndia (請求書 - インド) - ML パッケージ
- InvoicesJapan (請求書 - 日本) - ML パッケージ
- Invoices Shipping (船積送り状) - ML パッケージ
- Packing Lists (梱包明細書) - ML パッケージ
- Payslips (給与明細) - ML パッケージ
- Passports (パスポート) - ML パッケージ
- Purchase Orders (発注書) - ML パッケージ
- Receipts (領収書) - ML パッケージ
- RemittanceAdvices (送金通知書) - ML パッケージ
- UB-04 (健康保険請求フォーム) - ML パッケージ
- Utility Bills (公共料金の請求書) - ML パッケージ
- Vehicle Titles (自動車の権利書) - ML パッケージ
- W2 (米国の源泉徴収票) - ML パッケージ
- W9 (米国の納税申告書) - ML パッケージ
- その他のすぐに使える ML パッケージ
- パブリック エンドポイント
- トラフィック制限
- OCR の設定
- パイプライン
- OCR サービス
- サポートされている言語
- ディープ ラーニング
- ライセンス
概要
Document UnderstandingTM の機能を利用するには、次のようにいくつかの方法があります。
- DocumentUnderstanding.Activities パッケージは Studio Web、StudioX、およびデスクトップ版の Studio で利用でき、ファイルから新しいオートメーションを作成する場合や、プロジェクト バージョンをパブリッシュした後にジャーニーを続行する場合に、あらかじめ設定されています。
- IntelligentOCR パッケージを使用する。このパッケージは、Windows プロジェクトおよび Windows - レガシ プロジェクト用に設計されており、Document Understanding Process テンプレートに事前に構成済みです。
- クラウド API 呼び出しを使用する。この場合、任意のプログラミング言語で Document Understanding をサービスとして利用できます。
RPA 開発者である場合、DocumentUnderstanding.Activities をクラウド プロジェクトで使用できます。Document Understanding を使用すると、ドキュメントに関するあらゆるデータを Document Data という 1 つの入出力オブジェクト内で処理できます。また、Document Understanding アクティビティではドキュメントの種類のタクソノミーを設定する必要がないため、すぐに使えるモデルを簡単に利用できます。
以下の一部のアクティビティでは、Document Understanding、Marketplace、Studio Web で利用可能なデータ抽出オートメーション ビルダーを使用して、オートメーションを簡単に設定できます。
Document Understanding アクティビティでは、分割、トレーニング (モデルの微調整)、Production/Developer テナントのサポート、オンプレミスのサポート、ドキュメントの種類ごとの複数の抽出方法の各機能は、まだサポートされていないことに注意してください。
(アクティブ ラーニング エクスペリエンスを使用して作成された) モダン プロジェクトを利用する新しいオートメーション プロジェクトを開始する場合、DocumentUnderstanding.Activities を使用できます。
IntelligentOCR パッケージを試してみたい RPA 開発者は、ニーズに応じてさまざまな抽出モデルや分類モデルを使用できます。あるモデルがニーズに合わなければ、他の抽出器または分類器をバックアップ オプションとして使用できます。また、実行時に RPA コードを使用して、タクソノミー、ドキュメント オブジェクト モデル (DOM)、抽出結果を変更することもできます。
ただし、IntelligentOCR はその柔軟性ゆえに複雑であるため、複数のアクティビティやデータ型を扱う際には、学習に時間がかかります。
IntelligentOCR では、独自の分類器、抽出器、OCR エンジンを統合できます。実装例を確認するには、ドキュメント処理コードのサンプルのページをご覧ください。
ロボティック プロセス オートメーション (RPA) によるアプローチの代わりに API 呼び出しを使用することができます。API 呼び出しで可能な処理としては、プロジェクトの詳細情報 (使用する抽出器や分類器など) を取得する、Digitization API の使用を容易にする、特殊モデルと生成モデルの両方を使用してドキュメントのデータを分類および抽出する、以前にデジタル化、分類、抽出した情報を検証する、などがあります。
API の使用には、RPA などの任意のプログラミング/スクリプト言語を使用できます (呼び出しは HTTP を使用して実行するため)。
Swagger で API にアクセスするには、Document Understanding サービスのツールバーに移動し、[REST API] ドロップダウン リストを検索して、[Framework] を選択します。