- 概要
- Document Understanding Process
- クイックスタート チュートリアル
- フレームワーク コンポーネント
- ML パッケージ
- パイプライン
- Document Manager
- OCR サービス
- Automation Suite にデプロイされた Document Understanding
- AI Center スタンドアロンにデプロイされた Document Understanding
- ディープ ラーニング
- ライセンス
- 参照
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Document Understanding ガイド
データセット診断
新しいモデルをゼロからトレーニングするのは、ときに非常に手間のかかる作業です。
データセット診断機能では、モデルをトレーニングして適切な精度を得るために必要な手順に関するフィードバックやヒントが提供されるため、効果的なデータセットを構築できます。
データセット診断ツールは Document Manager の管理バーにあり、新しいモデルのトレーニング プロセス全体を通して視覚的かつ文字によるガイダンスを提供します。
管理バーに表示されるデータセットのステータス レベルには、以下の 3 種類があります。
- 赤 - ラベル付けされたトレーニング データの追加が必要です。
- オレンジ - ラベル付けされたトレーニング データの追加が推奨されます。
- 緑 - ラベル付けされたトレーニング データが必要量に達しています。
セッションでフィールドが作成されていない場合は、データセットのステータス レベルは灰色になります。
各ステータスの詳細は、データセット診断のポップアップ メニューで確認できます。[データセット診断] ボタンをクリックして開きます。
モデルのトレーニングに使用されるドキュメントに関する情報、インポートされたページの総数、およびラベル付けされたページの総数が表示されます。
色分けされたステータス バーの区切りは、モデルのトレーニングに必要なラベル付けされたページの推奨数と、データセット (ラベル付けされたデータとラベル付けされていないデータを含む) の実際のステータスによって決定されます。ステータス バーの色の上でホバーすると、各ステータスに関する追加情報がツールチップに表示されます。
[データセット] タブの数値はトレーニング セッションの標準フィールドと項目フィールドの数に基づいて計算されます。
-
赤 - モデルをトレーニングするには、ラベル付けされたデータをデータセットに追加する必要があります。
-
オレンジ - トレーニングするモデルの精度を向上するには、ラベル付けされたデータの追加が推奨されます。現状のデータのまま続行することもできますが、精度のレベルは期待されるほど高くありません。
-
緑 - データセットには、適切なトレーニングを行い正確な情報を抽出するのに十分な量のラベル付けされたデータがあります。
ラベル付けされた各フィールドに関する情報が表示されます。具体的には、ラベルのタグ付けが済んでいるトレーニング ページの総数、ラベル付けされたフィールドがある、評価されたドキュメントの総数、および現在のトレーニング セットのステータスを確認できます。
- フィールド - ラベル付けされたフィールドの名前です。
- トレーニング ページ - このフィールドがラベル付けされている、トレーニング セットと検証セットのページ数です。
- 評価ドキュメント - このフィールドがラベル付けされている、評価セットに含まれるドキュメントの数です。
- ステータス - 各フィールドのステータスです。 赤、オレンジ、緑の 3 つのオプションでマークされます。
[ステータス] バーのオプションは次のとおりです。
-
赤 - フィールドに関するデータが不足しており、追加のラベル付けが必要です。
-
オレンジ - 結果の関連性を高めるには、追加のページをラベル付けする必要があります。
-
緑色 - 結果の関連性を高めるのに十分な数のラベル付けされたページがあります。
[更新] と [閉じる] ボタンは両方のタブに適用されます。つまり、[データセット] タブで [更新] ボタンをクリックすると、[フィールド] タブも更新されます。
- 更新 - データセットの合計ページ数またはラベル付きページ数を変更した後に情報を更新するにはこのオプションを使用します。このポップアップ メニューは、数分ごとに両方のタブが同時に自動的に更新されます。この機能は自動更新のタイミング以外で更新する場合に使用します。
- 閉じる - 必要な情報の収集が完了したら、[閉じる] ボタンをクリックしてメニューを閉じます。どのタブでクリックしても、ポップアップ メニュー全体が閉じます。