Machine Learning-スコア
重要
Machine Learning Studio (クラシック) のサポートは、2024 年 8 月 31 日に終了します。 その日までに、Azure Machine Learning に切り替えすることをお勧めします。
2021 年 12 月 1 日以降、新しい Machine Learning Studio (クラシック) リソースは作成できません。 2024 年 8 月 31 日まで、既存の Machine Learning Studio (クラシック) リソースを引き続き使用できます。
- ML Studio (クラシック) から Azure Machine Learning への機械学習プロジェクトの移動に関する情報を参照してください。
- Azure Machine Learning についての詳細を参照してください。
ML Studio (クラシック) のドキュメントは廃止予定であり、今後更新されない可能性があります。
このセクションでは、Machine Learning Studio (クラシック) でスコアリング用に提供されているモジュールの一覧を示します。
注意
適用対象: Machine Learning Studio (クラシック)のみ
類似のドラッグ アンド ドロップ モジュールは Azure Machine Learning デザイナーで使用できます。
スコアリングは予測とも呼ばれ、新しい入力データを指定して、トレーニング済みの機械学習モデルに基づいて値を生成するプロセスです。 作成される値またはスコアは、将来の値の予測を表すことができますが、カテゴリまたは結果を表す可能性もあります。 スコアの意味は、指定したデータの種類と、作成したモデルの種類によって異なります。
Machine Learning Studio でのモデルの作成と使用 (クラシック)
機械学習の一般的なワークフローには、次のフェーズが含まれます。
- 適切なアルゴリズムを選択し、初期オプションを設定します。
- 互換性のあるデータに対してモデルをトレーニングします。
- モデル内のパターンに基づいて、新しいデータを使用して予測を作成する。
- モデルを評価して、予測が正確であるかどうか、どのくらいのエラーがあるか、オーバーフィットがあるかどうかを判断します。
Machine Learning Studio (クラシック) は、柔軟でカスタマイズ可能な機械学習のフレームワークをサポートしています。 このプロセスの各タスクは、特定の種類のモジュールによって実行されます。これは、変更、追加、または削除することができます。実験の残りの部分は中断されません。
このセクションのモジュールには、スコアリングのためのツールが含まれています。 機械学習のこのフェーズでは、予測を生成するために、トレーニング済みのモデルを新しいデータに適用します。 機械学習の結果を使用するアプリケーションにこれらの予測を送信するか、スコアリングの結果を使用してモデルの精度と有用性を評価することができます。
スコアリングの詳細
機械学習では、モデルと新しい入力を指定して新しい値を生成するプロセスを表しています。 "予測" ではなく、"score" という汎用用語が使用されます。これは、スコアリングプロセスでは、さまざまな種類の値が生成される可能性があるためです。
- 推奨される項目と類似性スコアの一覧。
- タイムシリーズモデルと回帰モデルの数値。
- 新しい入力が既存のカテゴリに属する可能性を示す確率値。
- 新しい項目が最も類似しているカテゴリまたはクラスターの名前。
- 分類モデルの予測されたクラスまたは結果。
注意
また、データ分析の結果として割り当てられた重みまたは値を意味するために使用されるワード スコア についても聞いたことがあります。 ただし、Machine Learning Studio (クラシック) では、スコアリングは通常、新しいデータから予測値を生成するプロセスを示します。
実験でこれらのモジュールのいずれかを追加する場合は、トレーニング済みの機械学習モデルといくつかの新しいデータを添付する必要があります。 実験または選択したモジュールを実行すると、スコアリングモジュールは新しいデータを取り込みし、モデルに基づいてスコアを計算して、テーブル内のスコアを返します。
スコアリングに使用されるデータ
入力として指定する新しいデータには、通常、モデルのトレーニングに使用したものと同じ列、ラベル、または結果列が必要です。
識別子としてのみ使用される列は、通常、モデルのトレーニング時に除外されます。したがって、スコア付けの際に除外する必要があります。 ただし、主キーなどの識別子は、後で 列の追加 モジュールを使用して、スコア付けデータセットと簡単に再結合できます。 このモジュールは、データセットのサイズが変更されていない限り、結合キーを指定しなくても機能します。
データセットに対してスコア付けを行う前に、欠損値と null を常に確認してください。 スコアリングの入力として使用されるデータに欠損値がある場合、欠損値は入力として使用されます。 Null が反映されるため、結果は通常、欠損値になります。
スコアリングモジュールの一覧
Machine Learning Studio (クラシック) では、さまざまなスコア付けモジュールが提供されます。 使用するモデルの種類に応じて、または実行するスコアリングタスクの種類に応じて1つを選択します。
変換の適用: 適切に指定されたデータ変換をデータセットに適用します。
このモジュールを使用して、保存されたプロセスを一連のデータに適用します。
クラスターにデータを割り当てる: 既存のトレーニング済みクラスタリングモデルを使用して、クラスターにデータを割り当てます。
既存の K を意味するクラスターモデルに基づいて新しいデータをクラスター化する場合は、このモジュールを使用します。
このモジュールは、非推奨とされていますが、既存の実験で使用できるようにする、"クラスターに割り当てる" (非推奨) モジュールに代わるものです。
スコアマッチボックスレコメンダー: matchbox レコメンダーを使用して、データセットの予測をスコア付けします。
推奨設定の生成、関連する項目またはユーザーの検索、または評価の予測を行う場合は、このモジュールを使用します。
モデルのスコア付け: トレーニング済みの分類または回帰モデルの予測をスコア付けします。
このモジュールは、他のすべての回帰モデルと分類モデル、およびいくつかの異常検出モデルに使用します。
関連タスク
- Vowpal Wabbit 向けの特別なスコアリングモジュールが用意されています。 「 Text Analytics」を参照してください。
- OpenCV ライブラリを使用して、事前トレーニング済みのモデル上の特殊なイメージクラスをスコア付けすることができます。
- タイムシリーズの異常検出モジュールは、傾向からの潜在的な偏差を表すスコアを生成します。
例
この Azure AI Gallery の例では、基本的なシナリオから高度なシナリオまで、スコアリングのプロセスを示しています。
ダイレクトマーケティングの二項分類: 予測値がマーケティングキャンペーンに対する顧客の反応であるシナリオで、スコアリングの基本的なワークフローを示します。
書籍のレビューの予測: テキストデータに対するスコアリング。 ロジスティック回帰モデルを使用します。
カウントを使用したラーニング: カウントベースの特性付けを使用して予測を行う方法を示します。
Logic Apps と Machine Learning によるコードなしのバッチスコアリング: Azure App Service の Logic Apps 機能を使用して自動化されたトレーニングとスコアリングのプロセスの全体を示します。
次の記事では、機械学習モデルを使用してスコア付けを行う方法について、実際の例を紹介しています。