Document Understanding ガイド

最終更新日時 2025年4月4日

デリバリー:

パイプラインについて

Document Understanding ML パッケージは、以下の 3 種類のパイプラインすべてを実行できます。

パイプライン実行が完了すると、それに関連付けられた出力とログが得られます。この情報を確認するには、左側のサイドバーにある [パイプライン] タブでパイプラインをクリックし、パイプラインビューを開きます。このビューに含まれる項目は以下のとおりです。

トレーニングパイプラインまたはフルパイプラインは、以下の操作にも使用できます。

トレーニング:

モデルをゼロからトレーニングすること。つまり、AI Center で DocumentUnderstanding ML パッケージを使用すること。

再トレーニング:

事前トレーニングされたベースモデルを使用してトレーニングすること。つまり、Invoices (請求書)、Receipts (領収書)、Purchase Orders (発注書) などの、AI Center の他のドキュメント抽出 ML パッケージの 1 つを使用すること。

自動再トレーニング:

AI Center でパイプラインを作成するときに設定できる環境変数の名前です。設定すると、パイプラインは最新のエクスポートされたデータセットをトレーニングに自動的に使用します。この変数は、データセットに検証ステーションからのデータが含まれているかどうかに依存しません。

微調整:

検証ステーションからのデータを含むデータセットを使用して、モデルをトレーニングまたは再トレーニングすること。

自動微調整:

自動再トレーニング環境変数機能を使用して、Document Manager の「スケジュールされたエクスポート」機能で検証ステーションから入手したデータを使用して、モデルを自動的にトレーニングすること。

前へOCR の設定

次へトレーニングパイプライン