データ変換 - スケールと削減
重要
Machine Learning Studio (クラシック) のサポートは、2024 年 8 月 31 日に終了します。 その日までに、Azure Machine Learning に切り替えすることをお勧めします。
2021 年 12 月 1 日以降、新しい Machine Learning Studio (クラシック) リソースは作成できません。 2024 年 8 月 31 日まで、既存の Machine Learning Studio (クラシック) リソースを引き続き使用できます。
- ML Studio (クラシック) から Azure Machine Learning への機械学習プロジェクトの移動に関する情報を参照してください。
- Azure Machine Learning についての詳細を参照してください。
ML Studio (クラシック) のドキュメントは廃止予定であり、今後更新されない可能性があります。
この記事では、数値データのMachine Learningに役立つ Machine Learning Studio (クラシック) のモジュールについて説明します。 機械学習の場合、一般的なデータ タスクには、クリッピング、ビン分割、数値の正規化が含まれます。 その他のモジュールでは、次元の削減がサポートされています。
注意
適用対象: Machine Learning Studio (クラシック) のみ
類似のドラッグ アンド ドロップ モジュールは Azure Machine Learning デザイナーで使用できます。
数値データのモデリング
数値変数の正規化、ビン分割、再配布などのタスクは、機械学習のためのデータ準備の重要な部分です。 このグループのモジュールでは、次のデータ準備タスクがサポートされています。
- さまざまなサイズまたは分布のビンにデータをグループ化する。
- 外れ値の削除または値の変更。
- 数値のセットを特定の範囲に正規化する。
- 高次元データセットから特徴列のコンパクト なセットを作成する。
関連タスク
- モデルの構築に使用する関連する便利な機能を選択する: [特徴の選択] または [線形判別分析] モジュールを使用します。
- 値の数に基づいて特徴を選択する: Counts モジュールでラーニングを使用します。
- 不足値を削除または置換する: 見つからないデータのクリーンアップ モジュールを使用 します。
- カテゴリ値を計算から派生した数値に置き換える: 不連続値の置換 モジュールを使用 します。
- 不連続列または数値列の確率分布を計算する: Evaluate Probability Function モジュールを使用 します。
- デジタル信号と波形をフィルター処理して変換する: フィルター モジュール を使用 します。
モジュールの一覧
この データ変換 - Scale および Reduce カテゴリには 、次のモジュールが含まれています。
- クリップ値: 外れ値を検出し、その値をクリップまたは置換します。
- データをビンにグループ化する: 数値データをビンに入れる。
- データの正規化: データセット値を標準の範囲に制限するために数値データを再スケーリングします。
- プリンシパル コンポーネント分析: より効率的な学習のために、次元が小さい一連の特徴を計算します。