Select Columns Transform (列変換の選択)

重要

Machine Learning Studio (クラシック) のサポートは、2024 年 8 月 31 日に終了します。 その日までに、Azure Machine Learning に切り替えすることをお勧めします。

2021 年 12 月 1 日以降、新しい Machine Learning Studio (クラシック) リソースは作成できません。 2024 年 8 月 31 日まで、既存の Machine Learning Studio (クラシック) リソースを引き続き使用できます。

ML Studio (クラシック) のドキュメントは廃止予定であり、今後更新されない可能性があります。

指定されたデータセットと同じ列のサブセットを選択する変換を作成します。

カテゴリ: データ変換/操作

注意

適用対象: Machine Learning Studio (クラシック)のみ

類似のドラッグ アンド ドロップ モジュールは Azure Machine Learning デザイナーで使用できます。

この記事では Machine Learning Studio (クラシック) で列の選択変換モジュールを使用する方法について説明します。 Select Columns Transform (列変換の選択) モジュールの目的は、予測可能で一貫性のある一連の列がダウンストリームの機械学習操作で常に使用されるようにすることです。

このモジュールは、特定の列を必要とするスコアリングなどのタスクに特に役立ちます。 使用可能な列を変更すると、実験が中断されるか、結果が変更される可能性があります。

Select Columns Transform (列変換の選択) を使用して、一連の列を作成して保存します。 次に、Apply Transformation (変換の適用) モジュールを使用してそれらの選択を新しいデータに適用します。

Select Columns Transform (列変換の選択) の使用方法

このシナリオでは、特徴選択を使用して、モデルのトレーニングに使用する列の動的セットを生成することを前提としています。 列の選択がスコア付けプロセスと同じになるようにするには、列の 選択変換 モジュールを使用して列の選択内容をキャプチャし、実験の別の場所に適用します。

  1. Studio (クラシック) で、実験に入力データセットを追加します。

  2. Filter Based Feature Selection (フィルターに基づく特徴選択) のインスタンスを追加します。

  3. モジュールを接続し、特徴選択モジュールを構成して、入力データセット内でいくつかの最適な特徴を自動的に検出します。

  4. Train Model (モデルのトレーニング) のインスタンスを追加し、Filter Based Feature Selection (フィルターに基づく特徴選択) の出力をトレーニングの入力として使用します。

    重要

    特徴量の重要度は列の値に基づいて決定されるため、Train Model (モデルのトレーニング) への入力に使用できる列を事前に把握することはできません。

  5. 次に、Select Columns Transform (列変換の選択) モジュールのインスタンスを接続します。

    これにより、他のデータセットに保存または適用できる変換として列の選択が生成されます。 この手順により、特徴の選択によって識別された列が、他のモジュールで再利用できるように保存されます。

  6. Score Model (モデルのスコア付け) モジュールを追加します。

    入力データセットは接続しないでください。

    代わりに、Apply Transformation (変換の適用) モジュールを追加し、特徴選択変換の出力を接続します。

    重要

    Filter Based Feature Selection (フィルターに基づく特徴選択) をスコアリング データセットに適用しても、同じ結果が得られるわけではありません。 特徴選択は値に基づいているため、異なる列セットが選択される可能性があります。その場合、スコアリング操作は失敗します。

  7. 実験を実行します。

列選択を保存してから適用するこのプロセスにより、同じデータ スキーマをトレーニングとスコアリングに使用することができます。

このモジュールの使用方法の例については、 Azure AI Galleryを参照してください。

想定される入力

名前 説明
目的の列を含むデータセット データ テーブル 必要な列のセットを含むデータセット

出力

名前 説明
列の選択変換 ITransform インターフェイス 指定されたデータセットと同じ列のサブセットを選択する変換です。

例外

例外 説明
エラー 0003 1 つまたは複数の入力が null または空の場合、例外が発生します。

こちらもご覧ください

操作
データセット内の列の選択