ai-center
latest
false
- リリース ノート
- 基本情報
- 通知
- プロジェクト
- データセット
- データのラベル付け
- ML パッケージ
- すぐに使えるパッケージ
- 概要
- English Text Classification (英語テキスト分類)
- French Text Classification (フランス語テキスト分類)
- Japanese Text Classification (日本語テキスト分類)
- Object Detection (オブジェクト検出)
- Text Classification (テキスト分類)
- TPOT AutoML Classification (TPOT AutoML分類)
- TPOT AutoML Regression (TPOT AutoML 回帰)
- TPOT XGBoost Classification (TPOT XGBoost 分類)
- TPOT XGBoost Regression (TPOT XGBoost 回帰)
- AI Computer Vision
- Communications Mining
- UiPath Document Understanding
- パイプライン
- ML スキル
- ML ログ
- AI Center の Document UnderstandingTM
- AI Center API
- ライセンス
- AI ソリューション テンプレート
- 使い方
- 基本的なトラブルシューティング ガイド
TPOT AutoML Regression (TPOT AutoML 回帰)
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。
新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。

AI Center
最終更新日時 2025年4月3日
TPOT AutoML Regression (TPOT AutoML 回帰)
[Open-Source Packages] > [Tabular Data] > [TPOTAutoMLRegression]
このモデルは、予測に使用する前にトレーニングする必要がある、一般的な表形式データ (数値のみ) の回帰モデルです。TPOT を使用して、最適なモデルを自動的に見つけます。
TPOT は、遺伝的プログラミングを使用してマシン ラーニングのパイプラインを最適化する、Python の自動マシン ラーニング ツールです。TPOT は、マシン ラーニングでの最も単調な処理を、考えられる何千ものパイプラインをインテリジェントに探索し、データに最も適したパイプラインを見つけることによって、自動化します。検索が終了すると (または、一定の時間が経過すると)、見つかった最適なパイプラインの Python コードが生成され、ユーザーはそこからパイプラインに変更を加えることができます。TPOT は scikit-learn に基づいて構築されているため、生成されるコードはすべて、scikit-learn ユーザーにとって見慣れたものとなります。
このパッケージでは、3 つの種類のパイプラインすべて (フル トレーニング、トレーニング、評価) がサポートされています。
この ML パッケージはデータセットで (サブディレクトリではなく) CSV ファイルを探します。
CSV ファイルは、次の 2 つのルールに従う必要があります。
- データの最初の行に、ヘッダー/列名を含む必要があります。
- すべての列は数値 (int、float) である必要があります。このモデルでは機能エンコードは実行できませんが、ターゲット エンコードは実行できます。モデルによってターゲット エンコードが実行される場合、予測時にモデルはターゲット変数のラベルも返します。
- max_time_mins: パイプラインを実行する時間 (分単位)。トレーニング時間が長いほど、TPOT が適切なモデルを見つけられる確率が高まります (既定値: 2)。
- target_column: ターゲット列の名前 (既定値: “target”)。
- scoring: TPOT makes use of sklearn.model_selection.cross_val_score for evaluating pipelines, and as such offers the same support for scoring functions (default: “accuracy”). Uses standard scikit-learn scoring metrics.
- keep_training: 一般的な TPOT 実行には、(小さいデータセットでなければ) 終了するまでに数時間から数日かかりますが、途中でいつでも実行を中断して、それまでの最適な結果を確認できます。keep_training が True に設定されている場合、TPOT は中断した箇所からトレーニングを続行します。
Note: If your file's target column is different than the default value (
target
), you need to update the target_column environment variable manually. You can do this in the Create new pipeline run window by selecting the + Add new button in the Enter parameters section. In the Environment variable field add the variable (target_column) and in the Value field add the name of the column from your file.
このモデルは、次の 2 つの出版物に基づいています。
- 「Scaling tree-based automated machine learning to biomedical big data with a feature set selector (機能セット セレクタを使用してツリーベースの自動マシン ラーニングをバイオメディカル ビッグデータに拡張する)」Trang T. Le、Weixuan Fu および Jason H. Moore (2020)
- 「Evaluation of a Tree-based Pipeline Optimization Tool for Automating Data Science (データ サイエンスを自動化するためのツリーベースのパイプライン最適化ツールの評価)」Randal S. Olson、Nathan Bartley、Ryan J. Urbanowicz、および Jason H. Moore