document-understanding
2021.10
false
- 基本情報
- フレームワーク コンポーネント
- ML パッケージ
- パイプライン
- データ マネージャー (Data Manager)
- OCR サービス
- Automation Suite にデプロイされた Document Understanding
- AI Center スタンドアロンにデプロイされた Document Understanding
- ディープ ラーニング
- ライセンス
- 参照
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。
新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
サポート対象外
Document Understanding ガイド
微調整する
AI Center は、検証ステーションを使用して人間が検証したデータに基づいて ML モデルを微調整する機能を備えています。
RPA ワークフローは既存の ML モデルを使用してドキュメントを処理するので、ドキュメントによっては、[検証ステーションを提示] アクティビティ (有人ボットで、またはブラウザーで Orchestrator Action Center を使用して利用可能) を使用した人間による検証が必要なことがあります。
検証ステーションで生成された検証済みデータは、[マシン ラーニング抽出器トレーナー] アクティビティを使用してエクスポートできます。また、AI Center で ML モデルを微調整するために使用できます。
既存の ML モデル (すぐに使えるモデルを含む) の微調整を行う場合を除き、検証ステーションのデータを使用して ML モデルをゼロからトレーニングする (DocumentUnderstanding ML パッケージ) ことはお勧めしません。
ML モデルの微調整の詳しい手順については、Data Manager のドキュメントの「ドキュメントをインポートする」をご覧ください。
微調整のためのデータセットを構築する方法について詳しくは、こちらをご覧ください。
重要: 検証ステーションのデータの正しい使用方法は、前のモデルのバージョンを繰り返し再トレーニングすることだと誤解されていることがよくあります。X.2 を取得するために、現在のバッチを使用してパッケージ X.1 をトレーニングしているのです。そして次のバッチを使用して X.2 のトレーニングを行い、X.3 を取得します (以降同様)。これは、製品の使用方法として間違っています。検証ステーションの各バッチを、最初に手動でラベル付けされたデータと同じ Data Manager セッションにインポートして、さらに大きなデータセットを作成する必要があります。そして、そのデータセットを、X.0 ML パッケージ バージョンで常にトレーニングする必要があります。