- 概要
- 基本情報
- アクティビティ
- Insights のダッシュボード
- Document Understanding Process
- クイック スタート チュートリアル
- フレームワーク コンポーネント
- ML パッケージ
- 概要
- Document Understanding - ML パッケージ
- DocumentClassifier (ドキュメント分類) - ML パッケージ
- OCR 機能を持つ ML パッケージ
- 1040 (米国の個人所得税申告書) - ML パッケージ
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ML パッケージ
- 1040 Schedule D (米国の個人所得税申告書のスケジュール D) - ML パッケージ
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ML パッケージ
- 1040x (米国の個人所得税修正申告書) - ML パッケージ
- 3949a - ML パッケージ
- 4506T (米国の納税申告証明依頼書) - ML パッケージ
- 709 (米国の贈与税申告書) - ML パッケージ
- 941x (米国の雇用主による四半期連邦税修正申告書) - ML パッケージ
- 9465 (米国の分割納付申請書) - ML パッケージ
- ACORD131 (アンブレラ/エクセス保険) - ML パッケージ
- ACORD140 (商業保険申込書の財物補償条項) - ML パッケージ
- ACORD25 (賠償責任保険証明書) - ML パッケージ
- Bank Statements (銀行預金残高証明書) - ML パッケージ
- BillsOfLading (船荷証券) - ML パッケージ
- Certificate of Incorporation (会社存在証明書) - ML パッケージ
- Certificate of Origin (原産地証明書) - ML パッケージ
- Checks (小切手) - ML パッケージ
- Children's Product Certificate (子供向け製品証明書) - ML パッケージ
- CMS 1500 (米国の医療保険請求フォーム) - ML パッケージ
- EU Declaration of Conformity (EU 適合宣言書) - ML パッケージ
- Financial Statements (財務諸表) - ML パッケージ
- FM1003 (米国の統一住宅ローン申請書) - ML パッケージ
- I9 (米国の就労資格証明書) - ML パッケージ
- ID Cards (ID カード) - ML パッケージ
- Invoices (請求書) - ML パッケージ
- InvoicesAustralia (請求書 - オーストラリア) - ML パッケージ
- InvoicesChina (請求書 - 中国) - ML パッケージ
- Invoices Hebrew (請求書 - ヘブライ語) - ML パッケージ
- InvoicesIndia (請求書 - インド) - ML パッケージ
- InvoicesJapan (請求書 - 日本) - ML パッケージ
- Invoices Shipping (船積送り状) - ML パッケージ
- Packing Lists (梱包明細書) - ML パッケージ
- Payslips (給与明細) - ML パッケージ
- Passports (パスポート) - ML パッケージ
- Purchase Orders (発注書) - ML パッケージ
- Receipts (領収書) - ML パッケージ
- RemittanceAdvices (送金通知書) - ML パッケージ
- UB-04 (健康保険請求フォーム) - ML パッケージ
- Utility Bills (公共料金の請求書) - ML パッケージ
- Vehicle Titles (自動車の権利書) - ML パッケージ
- W2 (米国の源泉徴収票) - ML パッケージ
- W9 (米国の納税申告書) - ML パッケージ
- その他のすぐに使える ML パッケージ
- パブリック エンドポイント
- トラフィック制限
- OCR の設定
- パイプライン
- OCR サービス
- サポートされている言語
- ディープ ラーニング
- ライセンス
ワン クリック抽出
ワン クリック抽出機能を試用すると、Document UnderstandingTM のインターフェイスから直接ドキュメントの抽出器を簡単にトレーニングできます。Document Understanding 内の新しいユーザー エクスペリエンスを利用することで、AI Center でデータセット、パイプライン、ML スキルを手動で作成する必要がなくなります。
この機能を使用する前に、Document Understanding プロジェクトが AI Center にリンクされていることを確認してください。
ワン クリック抽出機能を使用すると、既存の半構造化 AI のドキュメントの種類に基づいて新しい抽出器を作成できます。作成するには、[新しい抽出器] ボタンをクリックします。
[新しい抽出器] ボタンをクリックするとドロップダウンが開き、2 つのオプションとして [自動トレーニング] と [手動トレーニング] が表示されます。
[自動トレーニング] オプションは、抽出器を Document Understanding で直接トレーニングする場合に使用します。このオプションを選択した後、抽出器名を追加し、使用するドキュメントの種類を選択し、使用するモデルとそのバージョンを選択します。さらに、[GPU を使用] オプションを有効化または無効化して、モデルのバージョンを選択します。完了したら、[トレーニング] ボタンをクリックします。
抽出器のトレーニングを開始する前に、使用する予定のセッションで少なくとも 10 個のドキュメントがラベル付けされている必要があることに注意してください。
この機能は、ユーザーが以前に [抽出データセットをトレーニング] ポップアップ ウィンドウの [抽出器名] フィールドで指定した名前で、新しいデータセットを AI Center 内に自動的に作成します。
詳細
[抽出器] ページで抽出器の名前をクリックするか、アクション メニューをクリックして [詳細] オプションを選択すると、作成された自動トレーニング アクションの詳細を確認できます。
以下に [詳細] オプションで表示されるすべての情報のリストを示します。
- トレーニング セット - 処理されたドキュメントの数とページ数です。
- 抽出したページ - 抽出したページの数が示されます。
- F1 スコア - データセットの精度スコアをパーセンテージで示します。
- ステータス - 抽出アクションのステータスが表示されます。
- ドキュメントの種類 - アクションに使用されるドキュメントの種類のリストが表示されます。
- パッケージ名 - 使用する ML パッケージの名前です。
- パッケージ バージョン - 使用する ML パッケージ モデルのバージョンです。
- ML スキルの詳細 - データセット用に作成された ML スキルの URL が表示されます。この URL をコピーしてワークフローで使用できます。
- データセットのリンク - 作成した (パブリック) データセットのパブリック エンドポイント URL が表示されます。
- パイプラインの詳細 - データセット用に作成したパイプラインの URL が表示されます。
- ログを表示/非表示 - 作成したデータセットのすべてのログのリストを表示します。必要に応じてコピーして使用できます。
[手動トレーニング] オプションは、データセットを AI Center にエクスポートしてから AI Center でトレーニングする場合に使用します。このオプションを選択した後、データセット名を追加し、使用するドキュメントの種類を選択する必要があります。完了したら、[エクスポート] ボタンをクリックします。
詳細
[抽出器] ページで抽出器の名前をクリックするか、アクション メニューをクリックして [詳細] オプションを選択すると、作成された手動トレーニング アクションの詳細を確認できます。
以下に [詳細] オプションで表示されるすべての情報のリストを示します。
- トレーニング セット - 処理されたドキュメントの数とページ数です。
- 抽出したページ - 抽出したページの数が示されます。
- F1 スコア - データセットの精度スコアをパーセンテージで示します。
- ステータス - 抽出アクションのステータスが表示されます。
- ドキュメントの種類 - アクションに使用されるドキュメントの種類のリストが表示されます。
- パッケージ名 - 使用する ML パッケージの名前です。
- パッケージ バージョン - 使用する ML パッケージ モデルのバージョンです。
- ML スキルの詳細 - データセット用に作成された ML スキルの URL が表示されます。この URL をコピーしてワークフローで使用できます。
- データセットのリンク - 作成した (パブリック) データセットのパブリック エンドポイント URL が表示されます。
- パイプラインの詳細 - データセット用に作成したパイプラインの URL が表示されます。
- ログを表示/非表示 - 作成したデータセットのすべてのログのリストを表示します。必要に応じてコピーして使用できます。
すべての抽出アクションのステータスを確認するには、プロジェクト ページの [抽出器] タブを使用します。
[抽出器] タブを選択すると 5 つの異なる列が表示されます。各列には、作成された分類アクションの情報が含まれています。列を個別にアルファベット順に昇順または降順で並べ替えることも、既定の状態のまま (作成日時順に最新のものから順に編成) にしておくこともできます。
- 名前 - 分類アクションの名前が表示されます。
- 種類 - 分類アクションの種類 (エクスポートまたはトレーニング) が表示されます。
- ドキュメントの種類 - 使用されるドキュメントの種類を表示します。
- ステータス - アクションのステータスが表示されます。各アクションには複数のステータスがあります。詳しくは下表をご覧ください。
- 作成日 - 作成日時が表示されます。
- 更新 - すべてのアクションのステータスを更新し、最新のステータスを表示します。
Status |
説明 |
[分類] オプション |
---|---|---|
利用可能 |
アクションが正常に実行されました。 |
自動トレーニング |
InProgress |
アクションはまだ実行されています。 |
自動トレーニング |
エクスポートが完了しました |
アクションが正常に実行されました。 |
手動トレーニング |
エクスポートしています |
アクションはまだ実行されています。 |
手動トレーニング |
開始前 |
アクションの実行がまだ開始されていません。 |
自動トレーニング 手動トレーニング |
非同期 |
Document Understanding のステータスが AI Center のステータスと同期されていません。AI Center に移動し、作成した抽出器に対応する ML スキルのステータスを確認します。ML スキルがデプロイ解除済みになっている場合は、再度 ML スキルをデプロイします。 |
自動トレーニング 手動トレーニング |
中断 |
アクションが一時停止されました。 |
自動トレーニング 手動トレーニング |