- 概要
- Document Understanding Process
- クイックスタート チュートリアル
- フレームワーク コンポーネント
- ML パッケージ
- パイプライン
- データ マネージャー (Data Manager)
- OCR サービス
- Automation Suite にデプロイされた Document Understanding
- AI Center スタンドアロンにデプロイされた Document Understanding
- ライセンス
- 参照
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Document Understanding ガイド
パイプラインについて
Document Understanding ML パッケージは、以下の 3 種類のパイプラインすべてを実行できます。
パイプライン実行が完了すると、それに関連付けられた出力とログが得られます。この情報を確認するには、左側のサイドバーにある [パイプライン] タブでパイプラインをクリックし、パイプライン ビューを開きます。このビューに含まれる項目は以下のとおりです。
- パイプラインの詳細: 種類、ML パッケージの名前とバージョン、データセット、GPU の使用状況、パラメーター、実行時間などが表示されます。
- [出力] ペイン: パイプラインの詳細を要約した
_results.json
ファイルが必ず含まれます。 - [ログ] ページ: 左側のサイドバーにある [ML ログ] タブでもログを取得できます。
トレーニング パイプラインまたはフル パイプラインは、以下の操作にも使用できます。
トレーニング:
モデルをゼロからトレーニングすること。つまり、AI Center で DocumentUnderstanding ML パッケージを使用すること。
再トレーニング:
事前トレーニングされたベース モデルを使用してトレーニングすること。つまり、Invoices (請求書)、Receipts (領収書)、Purchase Orders (発注書) などの、AI Center の他のドキュメント抽出 ML パッケージの 1 つを使用すること。
自動再トレーニング:
AI Center でパイプラインを作成するときに設定できる環境変数の名前です。設定すると、パイプラインは最新のエクスポートされたデータセットをトレーニングに自動的に使用します。この変数は、データセットに検証ステーションからのデータが含まれているかどうかに依存しません。
微調整:
検証ステーションからのデータを含むデータセットを使用して、モデルをトレーニングまたは再トレーニングすること。
自動微調整:
自動再トレーニング環境変数機能を使用して、Document Manager の「スケジュールされたエクスポート」機能で検証ステーションから入手したデータを使用して、モデルを自動的にトレーニングすること。