Document Understanding ガイド

デリバリー:

最終更新日時 2025年6月10日

ワンクリック抽出

ワンクリック抽出機能を試用すると、Document Understanding^TM のインターフェイスから直接ドキュメントの抽出器を簡単にトレーニングできます。Document Understanding 内の新しいユーザーエクスペリエンスを利用することで、AI Center でデータセット、パイプライン、ML スキルを手動で作成する必要がなくなります。

この機能を使用する前に、Document Understanding プロジェクトが AI Center にリンクされていることを確認してください。

抽出器のオプション

ワンクリック抽出機能を使用すると、既存の半構造化 AI のドキュメントの種類に基づいて新しい抽出器を作成できます。作成するには、[新しい抽出器] ボタンをクリックします。

[新しい抽出器] ボタンをクリックするとドロップダウンが開き、2 つのオプションとして [自動トレーニング] と [手動トレーニング] が表示されます。

自動トレーニング

[自動トレーニング] オプションは、抽出器を Document Understanding で直接トレーニングする場合に使用します。このオプションを選択した後、抽出器名を追加し、使用するドキュメントの種類を選択し、使用するモデルとそのバージョンを選択します。さらに、[GPU を使用] オプションを有効化または無効化して、モデルのバージョンを選択します。完了したら、[トレーニング] ボタンをクリックします。

注:

抽出器のトレーニングを開始する前に、使用する予定のセッションで少なくとも 10 個のドキュメントがラベル付けされている必要があることに注意してください。

この機能は、ユーザーが以前に [抽出データセットをトレーニング] ポップアップウィンドウの [抽出器名] フィールドで指定した名前で、新しいデータセットを AI Center 内に自動的に作成します。

注: 追加のデータをラベル付けした後に抽出器を更新するには、新しい抽出器を別の名前で作成する必要があります。

詳細

[抽出器] ページで抽出器の名前をクリックするか、アクションメニューをクリックして [詳細] オプションを選択すると、作成された自動トレーニングアクションの詳細を確認できます。

以下に [詳細] オプションで表示されるすべての情報のリストを示します。

トレーニングセット - 処理されたドキュメントの数とページ数です。
抽出したページ - 抽出したページの数が示されます。
F1 スコア - データセットの精度スコアをパーセンテージで示します。
ステータス - 抽出アクションのステータスが表示されます。
ドキュメントの種類 - アクションに使用されるドキュメントの種類のリストが表示されます。
パッケージ名 - 使用する ML パッケージの名前です。
パッケージバージョン - 使用する ML パッケージモデルのバージョンです。
ML スキルの詳細 - データセット用に作成された ML スキルの URL が表示されます。この URL をコピーしてワークフローで使用できます。
データセットのリンク - 作成した (パブリック) データセットのパブリックエンドポイント URL が表示されます。
パイプラインの詳細 - データセット用に作成したパイプラインの URL が表示されます。
ログを表示/非表示 - 作成したデータセットのすべてのログのリストを表示します。必要に応じてコピーして使用できます。

手動トレーニング

[手動トレーニング] オプションは、データセットを AI Center にエクスポートしてから AI Center でトレーニングする場合に使用します。このオプションを選択した後、データセット名を追加し、使用するドキュメントの種類を選択する必要があります。完了したら、[エクスポート] ボタンをクリックします。

注: 追加のデータをラベル付けした後に抽出器を更新するには、新しい抽出器を別の名前で作成する必要があります。

詳細

[抽出器] ページで抽出器の名前をクリックするか、アクションメニューをクリックして [詳細] オプションを選択すると、作成された手動トレーニングアクションの詳細を確認できます。

以下に [詳細] オプションで表示されるすべての情報のリストを示します。

トレーニングセット - 処理されたドキュメントの数とページ数です。
抽出したページ - 抽出したページの数が示されます。
F1 スコア - データセットの精度スコアをパーセンテージで示します。
ステータス - 抽出アクションのステータスが表示されます。
ドキュメントの種類 - アクションに使用されるドキュメントの種類のリストが表示されます。
パッケージ名 - 使用する ML パッケージの名前です。
パッケージバージョン - 使用する ML パッケージモデルのバージョンです。
ML スキルの詳細 - データセット用に作成された ML スキルの URL が表示されます。この URL をコピーしてワークフローで使用できます。
データセットのリンク - 作成した (パブリック) データセットのパブリックエンドポイント URL が表示されます。
パイプラインの詳細 - データセット用に作成したパイプラインの URL が表示されます。
ログを表示/非表示 - 作成したデータセットのすべてのログのリストを表示します。必要に応じてコピーして使用できます。

抽出器のステータス

すべての抽出アクションのステータスを確認するには、プロジェクトページの [抽出器] タブを使用します。

概要

[抽出器] タブを選択すると 5 つの異なる列が表示されます。各列には、作成された分類アクションの情報が含まれています。列を個別にアルファベット順に昇順または降順で並べ替えることも、既定の状態のまま (作成日時順に最新のものから順に編成) にしておくこともできます。

名前 - 分類アクションの名前が表示されます。
種類 - 分類アクションの種類 (エクスポートまたはトレーニング) が表示されます。
ドキュメントの種類 - 使用されるドキュメントの種類を表示します。
ステータス - アクションのステータスが表示されます。各アクションには複数のステータスがあります。詳しくは下表をご覧ください。
作成日 - 作成日時が表示されます。
更新 - すべてのアクションのステータスを更新し、最新のステータスを表示します。

Status	説明	[分類] オプション
利用可能	アクションが正常に実行されました。	自動トレーニング
InProgress	アクションはまだ実行されています。	自動トレーニング
エクスポートが完了しました	アクションが正常に実行されました。	手動トレーニング
エクスポートしています	アクションはまだ実行されています。	手動トレーニング
開始前	アクションの実行がまだ開始されていません。	自動トレーニング手動トレーニング
非同期	Document Understanding のステータスが AI Center のステータスと同期されていません。AI Center に移動し、作成した抽出器に対応する ML スキルのステータスを確認します。ML スキルがデプロイ解除済みになっている場合は、再度 ML スキルをデプロイします。	自動トレーニング手動トレーニング
中断	アクションが一時停止されました。	自動トレーニング手動トレーニング