document-understanding
2020.10
false
- 基本情報
- フレームワーク コンポーネント
- データ抽出トレーニングの概要
- [抽出器トレーニング スコープ] の抽出器を設定ウィザード
- マシン ラーニング抽出器トレーナー
- データ抽出トレーニング関連のアクティビティ
- AI Center での Document Understanding
- パイプライン
- ML パッケージ
- データ マネージャー (Data Manager)
- OCR サービス
- ライセンス
- 参照
マシン ラーニング抽出器トレーナー
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。
非推奨
Document Understanding ガイド
Last updated 2024年7月29日
マシン ラーニング抽出器トレーナー
[マシン ラーニング抽出器トレーナー] は、選択したディレクトリ内で、人間からのフィードバックを収集します。データを収集した後に ML モデルを再トレーニングするには、ディレクトリのコンテンツを圧縮して、キュレーション用に Data Manager にアップロードするだけです。
[マシン ラーニング抽出器] と同じルールが、[マシン ラーニング抽出器トレーナー] にも適用されます。こちらをご覧ください。
以下に、[マシン ラーニング抽出器トレーナー] アクティビティを使用する場合に実行する必要のある手順を示します。
- タクソノミー マネージャー ウィザードを使用して、ドキュメントの種類とフィールドを定義します。
- [抽出器トレーニング スコープ] アクティビティ内の [マシン ラーニング抽出器トレーナー] をドラッグします。
- 自動的に開く [マシン ラーニング抽出器] ウィザードで、エンドポイントの情報を追加します。
- 入力した値をアクティビティ (より正確にはエンドポイント) の入力引数としても使用する場合は、[アクティビティの引数を更新] チェックボックスをオンにします。
- [機能を取得] ボタンをクリックします。この操作の後、ウィザードが閉じます。
- [出力フォルダー] の値を入力します。
- [抽出器トレーニング スコープ] の [抽出器を設定] オプションを選択します。ウィザードが表示されます。
- これで、[マシン ラーニング抽出器トレーナー] を設定できるようになりました。適用先ドキュメントの種類を展開し、該当するフィールドの横のチェックボックスをクリックして、トレーニングするフィールドの選択を開始します。
- テキストボックスに手動で入力するか、表示されるドロップダウン リストから各フィールドにマッピングする適切なデータを選択します。ドロップダウン リストには、[マシン ラーニング抽出器トレーナー] が、[マシン ラーニング抽出器] ウィザードで入力されたエンドポイントを使用し、抽出機能として宣言した、すべてのフィールドが含まれます。
注: チェックボックスはチェックしてもテキストボックスは空のままにしておいた場合、テキストボックスにはローカルのタクソノミーのドキュメントの種類の ID が自動的に入力されます。変更は、保存後に適用されます。抽出器の内部タクソノミーへのアクセス権がない場合に、フィールド ID に長い文字列を使用したくない場合は、値を手動で入力することをお勧めします。
- 抽出器の最新機能を使用しているかどうかを確認するには、[抽出器機能を取得または更新] をクリックして、[マシン ラーニング抽出器] ウィザードを開きます。
- ドロップダウン リストのオプションの 1 つを選択すると、そのフィールドが自動的に確認されます。
- 抽出結果に基づいて抽出器をトレーニングするには、抽出器として以前使用した [フレームワーク エイリアス] フィールドに、正確な英数字の値を設定します。
- すべてのフィールドを適切に設定したら、[保存] ボタンを選択します。
重要: 2 つの異なるフィールドに対して同じオプションを選択することはできません。