document-understanding

latest

false

重要 :

このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。新しいコンテンツの翻訳は、およそ 1 ～ 2 週間で公開されます。

Document Understanding ガイド

Measure

[評価] セクションでは、プロジェクトの全体的なステータスを確認し、改善の余地がある領域を確認できます。

プロジェクトの評価

このページの主な測定値は、プロジェクトの総合的なスコアです。

この測定値は、すべてのドキュメントの種類の分類器と抽出器のスコアを考慮して算出されています。各要因のスコアはモデルの評価に対応しており、「分類の評価」と「抽出の評価」でそれぞれ確認できます。

モデルの評価は、分類モデルのパフォーマンスを視覚化するのに役立つ機能です。評価は、次のように 0 から 100 までのモデルのスコアとして表されます。

不良 (0-49)
平均的 (50-69)
良好 (70-89)
優秀 (90-100)

モデルのスコアに関係なく、トレーニングを停止するタイミングはプロジェクトのニーズに応じてユーザーが決定します。モデルが「優秀」と評価されていても、すべてのビジネス要件を満たすとは限りません。

注:

[測定] ページから直接、任意のモデルの新しいトレーニング実行を開始できます。各モデルの横にある [モデルのトレーニング ] ステータスピルは [ トレーニングを開始 ] アクションを示します。モデルのアノテーションページに移動する必要はありません。ボタンのステートとトレーニングライフサイクルについて詳しくは、「トレーニングの実行を開始する」をご覧ください。

分類の評価

分類スコアでは、モデルのパフォーマンスに加えてデータセットのサイズと品質も考慮されます。

注:

分類スコアは、ドキュメントの種類が 2 つ以上作成されている場合にのみ利用可能です。

[分類] を選択すると、右側に 2 つのタブが表示されます。

要因: モデルのパフォーマンスを向上させるための推奨事項が表示されます。ドキュメントの種類ごとに、データセットのサイズやトレーニング済みのモデルのパフォーマンスに関する推奨事項を確認できます。
メトリック: トレーニングドキュメントとテストドキュメントの数、適合率、精度、再現率、ドキュメントの種類ごとの F1 スコアなど、役立つメトリックを提供します。

抽出の評価

抽出スコアでは、モデルの全体的なパフォーマンスに加えてデータセットのサイズと品質も考慮されます。このビューは各ドキュメントの種類に分割されます。[ アノテーションを行う] を選択して、各ドキュメントの種類の [ アノテーションを行う] ビューに直接移動することもできます。

[抽出] ビューから利用可能なドキュメントの種類を選択すると、右側に以下の 3 つのタブが表示されます。

要因: モデルのパフォーマンスを向上させるための推奨事項が表示されます。選択したドキュメントの種類のデータセットのサイズ (アップロードされたドキュメントの数、アノテーション済みのドキュメントの数) またはトレーニング済みのモデルのパフォーマンス (フィールドの精度) に関する推奨事項を確認できます。
データセット: モデルのトレーニングに使用されるドキュメントに関する情報、インポートされたページの総数、およびラベル付けされたページの総数が表示されます。
メトリック: 選択したドキュメントの種類のフィールド名、トレーニングステータスの数、精度などの有用な情報とメトリックが表示されます。[高度なメトリックをダウンロード] ボタンを使用して、抽出モデルの高度なメトリックにアクセスすることもできます。この機能を使用すると、バッチごとの詳細なメトリックとモデルの結果を含む Excel ファイルをダウンロードできます。

データセット診断

[データセット] タブでは、モデルをトレーニングして適切な精度を得るために必要な手順に関するフィードバックや推奨事項が提供されるため、効果的なデータセットを構築できます。

管理バーに表示されるデータセットのステータスレベルには、以下の 3 種類があります。

赤 - ラベル付けされたトレーニングデータの追加が必要です。
オレンジ - ラベル付けされたトレーニングデータの追加が推奨されます。
薄い緑 - ラベル付けされたトレーニングデータは推奨事項を満たしています。
濃い緑 - ラベル付けされたトレーニングデータは推奨事項を満たしています。ただし、パフォーマンスの低いフィールドには、追加のデータが必要である可能性があります。

セッションでフィールドが作成されていない場合は、データセットのステータスレベルは灰色になります。

モデルを比較

[評価] セクションで、分類モデルまたは抽出モデルの 2 つのバージョンのパフォーマンスを比較できます。

分類モデルの比較

分類モデルの 2 つのバージョンのパフォーマンスを比較するには、まず [評価] セクションに移動します。次に、目的の分類モデルの [モデルを比較] を選択します。

各列の上部にあるドロップダウンリストから、比較するバージョンを選択できます。既定では、現在のバージョン (利用可能な最新バージョンを示します) が左側で選択され、最新のパブリッシュ済みのバージョンが右側で選択されます。

図 1.分類モデルの比較

分類モデルの比較は、以下の 4 つの主要なメトリックに依存します。

適合率: 陽性と予測されたインスタンスの合計数に対する、正しく予測された陽性のインスタンスの割合です。適合率の高いモデルでは偽陽性が少なくなります。
精度: インスタンスの合計数のうちの、正しい予測数 (真陽性と真陰性の両方を含む) の割合です。
再現率: 正しく特定された実際の陽性のケースの割合です。
F1 スコア: 適合率と再現率の調和平均です。上記の 2 つのメトリックのバランスを取ることを目的としています。偽陽性と偽陰性のトレードオフとして機能します。

表示されるドキュメントの種類の順序は、比較で使われた最新バージョンで使用されていた順序です。比較対象バージョンのいずれかで利用できないドキュメントの種類がある場合、各評価の値は [該当なし] に置き換えられます。

注:

現在のバージョンでは削除されているものの、[ モデルを比較 ] 機能が利用可能になる前の古いバージョンでは利用可能だったフィールドがある場合、その名前は [不明] に置き換えられます。

抽出モデルの比較

抽出モデルの 2 つのバージョンのパフォーマンスを比較するには、まず [評価] セクションに移動します。次に、目的の抽出モデルの [モデルを比較] を選択します。

図 2. 抽出モデルの比較

抽出モデルの比較は、以下の主要なメトリックに依存します。

フィールド名: アノテーションフィールドの名前です。
コンテンツの種類: フィールドのコンテンツの種類です。
- 文字列
- Number
- 日付
- 電話番号
- ID 番号
評価: 抽出フィールドのパフォーマンスを視覚化するのに役立つ、モデルのスコアです。
精度: モデルが行う予測の合計数のうちの、正しいものの割合です。

表示されるフィールド名の順序は、比較で使われた最新バージョンで使用されていた順序です。比較対象バージョンのいずれかで利用できないフィールド名がある場合、各評価の値は [該当なし] に置き換えられます。

注:

[表] セクションで、表のフィールドのスコアも比較できます。

各バージョンの高度なメトリックのファイルは、比較ページの [高度なメトリックをダウンロード] ボタンからダウンロードできます。

プロジェクトの評価
分類の評価
抽出の評価
データセット診断
モデルを比較
分類モデルの比較
抽出モデルの比較

このページは役に立ちましたか?

前へ開発

次へ公開

Document Understanding ガイド

プロジェクトの評価​

分類の評価​

抽出の評価​

データセット診断​

モデルを比較​

分類モデルの比較​

抽出モデルの比較​