- 概要
- 基本情報
- Activities (アクティビティ)
- Insights のダッシュボード
- Document Understanding Process
- クイック スタート チュートリアル
- フレームワーク コンポーネント
- 詳細
- 概要
- Document Understanding - ML パッケージ
- DocumentClassifier (ドキュメント分類) - ML パッケージ
- OCR 機能を持つ ML パッケージ
- 1040 (米国の個人所得税申告書) - ML パッケージ
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ML パッケージ
- 1040 Schedule D (米国の個人所得税申告書のスケジュール D) - ML パッケージ
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ML パッケージ
- 1040x (米国の個人所得税修正申告書) - ML パッケージ
- 3949a - ML パッケージ
- 4506T (米国の納税申告証明依頼書) - ML パッケージ
- 709 (米国の贈与税申告書) - ML パッケージ
- 941x (米国の雇用主による四半期連邦税修正申告書) - ML パッケージ
- 9465 (米国の分割納付申請書) - ML パッケージ
- ACORD125 (企業向け保険契約申込書) - ML パッケージ
- ACORD126 (企業総合賠償責任保険) - ML パッケージ
- ACORD131 (アンブレラ/エクセス保険) - ML パッケージ
- ACORD140 (商業保険申込書の財物補償条項) - ML パッケージ
- ACORD25 (賠償責任保険証明書) - ML パッケージ
- Bank Statements (銀行預金残高証明書) - ML パッケージ
- BillsOfLading (船荷証券) - ML パッケージ
- Certificate of Incorporation (会社存在証明書) - ML パッケージ
- Certificate of Origin (原産地証明書) - ML パッケージ
- Checks (小切手) - ML パッケージ
- Children's Product Certificate (子供向け製品証明書) - ML パッケージ
- CMS 1500 (米国の医療保険請求フォーム) - ML パッケージ
- EU Declaration of Conformity (EU 適合宣言書) - ML パッケージ
- Financial Statements (財務諸表) - ML パッケージ
- FM1003 (米国の統一住宅ローン申請書) - ML パッケージ
- I9 (米国の就労資格証明書) - ML パッケージ
- ID Cards (ID カード) - ML パッケージ
- Invoices (請求書) - ML パッケージ
- InvoicesAustralia (請求書 - オーストラリア) - ML パッケージ
- InvoicesChina (請求書 - 中国) - ML パッケージ
- Invoices Hebrew (請求書 - ヘブライ語) - ML パッケージ
- InvoicesIndia (請求書 - インド) - ML パッケージ
- InvoicesJapan (請求書 - 日本) - ML パッケージ
- Invoices Shipping (船積送り状) - ML パッケージ
- Packing Lists (梱包明細書) - ML パッケージ
- Payslips (給与明細) - ML パッケージ
- Passports (パスポート) - ML パッケージ
- Purchase Orders (発注書) - ML パッケージ
- Receipts (領収書) - ML パッケージ
- RemittanceAdvices (送金通知書) - ML パッケージ
- UB-04 (健康保険請求フォーム) - ML パッケージ
- Utility Bills (公共料金の請求書) - ML パッケージ
- Vehicle Titles (自動車の権利書) - ML パッケージ
- W2 (米国の源泉徴収票) - ML パッケージ
- W9 (米国の納税申告書) - ML パッケージ
- その他のすぐに使える ML パッケージ
- パブリック エンドポイント
- トラフィック制限
- OCR の設定
- パイプライン
- OCR サービス
- サポートされている言語
- ディープ ラーニング
- データおよびセキュリティ
- ライセンスと請求ロジック

Document Understanding classic user guide
ワン クリック抽出
Use the One Click Extraction feature to easily train document extractors straight from the Document UnderstandingTM interface. This feature allows bypassing the need for manually creating Datasets, Pipelines, and ML Skills in AI Center with the help of a new user experience within Document Understanding.
Make sure that your Document Understanding project is linked to AI Center before using this functionality.
抽出器のオプション
You can use One Click Extraction functionality to create a new extractor based on an existing semi-structured AI document type by clicking the New Extractor button.
The New Extractor button opens a drop-down with two options: Automated Training and Manual Training.
自動トレーニング
Use the Automated Training option for training an extractor straight in Document Understanding. Once you choose this option, you have to add an Extractor Name, select the preferred Document Type, select the Model that you want to use, and its version, enable or disable the Use GPU option and select the version of the model. When finished, click on the Train button.
抽出器のトレーニングを開始する前に、使用する予定のセッションで少なくとも 10 個のドキュメントがラベル付けされている必要があることに注意してください。

この機能は、ユーザーが以前に [抽出データセットをトレーニング] ポップアップ ウィンドウの [抽出器名] フィールドで指定した名前で、新しいデータセットを AI Center 内に自動的に作成します。
To update an extractor after labeling additional data, you need to create a new extractor under a distinct name.
詳細
You can see more details about the created Automated Training action by clicking on the name of the extractor from the Extractors page, or by clicking on the actions menu, and selecting the Details option.
以下に [詳細] オプションで表示されるすべての情報のリストを示します。
- Training set - Specifies the number of documents and number of pages processed.
- Pages Extracted - Specifies the number of extracted pages.
- F1 Score - Provides an accuracy score percentage for the dataset.
- Status - Provides the status of the extraction action.
- ドキュメントの種類 - アクションに使用されるドキュメントの種類のリストが表示されます。
- Package Name - Provides the name of the used ML Package.
- Package Version - Provides the version of the used ML Package model.
- ML スキルの詳細 - データセット用に作成された ML スキルの URL が表示されます。この URL をコピーしてワークフローで使用できます。
- Dataset link - Provides the public endpoint URL of the created (public) dataset.
- パイプラインの詳細 - データセット用に作成したパイプラインの URL が表示されます。
- View/Hide Logs - Provides a list with all the logs of the created dataset. You can copy it and use it when needed.
手動トレーニング
Use the Manual Training option to export a dataset to AI Center and then train it in AI Center. Once you choose this option, you have to add a Dataset Name and select the preferred Document Type. When finished, click on the Export button.

To update an extractor after labeling additional data, you need to create a new extractor under a distinct name.
詳細
You can see more details about the created Manual Training action by clicking on the name of the extractor from the Extractors page, or by clicking on the actions menu, and selecting the Details option.
以下に [詳細] オプションで表示されるすべての情報のリストを示します。
- Training set - Specifies the number of documents and number of pages processed.
- Pages Extracted - Specifies the number of extracted pages.
- F1 Score - Provides an accuracy score percentage for the dataset.
- Status - Provides the status of the extraction action.
- ドキュメントの種類 - アクションに使用されるドキュメントの種類のリストが表示されます。
- Package Name - Provides the name of the used ML Package.
- Package Version - Provides the version of the used ML Package model.
- ML スキルの詳細 - データセット用に作成された ML スキルの URL が表示されます。この URL をコピーしてワークフローで使用できます。
- Dataset link - Provides the public endpoint URL of the created (public) dataset.
- パイプラインの詳細 - データセット用に作成したパイプラインの URL が表示されます。
- View/Hide Logs - Provides a list with all the logs of the created dataset. You can copy it and use it when needed.
抽出器のステータス
You can check the status of all your extraction actions by using the Extractors tab from your project page.
概要
[抽出器] タブを選択すると 5 つの異なる列が表示されます。各列には、作成された分類アクションの情報が含まれています。列を個別にアルファベット順に昇順または降順で並べ替えることも、既定の状態のまま (作成日時順に最新のものから順に編成) にしておくこともできます。
- Name - Displays the name of the classification actions.
- Type - Displays the type of classification action (export or train).
- Document Type - Displays the used Document type.
- ステータス - アクションのステータスが表示されます。各アクションには複数のステータスがあります。詳しくは下表をご覧ください。
- Creation date - Displays the creation date.
- Refresh - Refreshes the statuses for all actions, displaying the most recent ones.
| ステータス | 説明 | [分類] オプション |
|---|---|---|
| 利用可能 | アクションが正常に実行されました。 | 自動トレーニング |
| InProgress | アクションはまだ実行されています。 | 自動トレーニング |
| エクスポートが完了しました | アクションが正常に実行されました。 | 手動トレーニング |
| エクスポートしています | アクションはまだ実行されています。 | 手動トレーニング |
| 開始前 | アクションの実行がまだ開始されていません。 | Automated Training Manual Training |
| 非同期 | Document Understanding のステータスが AI Center のステータスと同期されていません。AI Center に移動し、作成した抽出器に対応する ML スキルのステータスを確認します。ML スキルがデプロイ解除済みになっている場合は、再度 ML スキルをデプロイします。 | Automated Training Manual Training |
| 中断 | アクションが一時停止されました。 | Automated Training Manual Training |
アクション メニュー
アクション メニューは右側にあり、メニューを開くと以下のオプションを利用できます。
- URL をコピー - 自動トレーニング アクションで作成したパブリック エンドポイントの URL をコピーできます。
- 詳細 - 作成したアクションの情報が表示されます。
- Delete - Deletes the created action from both Document Understanding and AI Center.
- ML スキルを停止 - 自動トレーニング アクションの ML スキルを停止します。