モデルの精度をグラフ化するためのツール (Analysis Services - データ マイニング)

[マイニング精度チャート] タブには、マイニング モデルの検証に使用できるさまざまなツールが用意されています。このタブは、SQL Server Management Studio と Business Intelligence Development Studio のどちらにも用意されています。

  • リフト チャート、利益チャート、および散布図。すべて [リフト チャート] タブで表示できます。[入力の選択] タブを使用してモデルの選択とオプションの設定を行った後、[リフト チャート] タブをクリックして、[グラフの種類] ボックスの一覧からグラフの種類を選択します。モデルが線形回帰を表す場合は自動的に散布図が表示されます。

  • 分類マトリックス (混同表とも呼ばれます)。[入力の選択] タブで構成して、[分類マトリックス] タブで表示できます。

  • クロス検証レポート。[マイニング精度チャート] タブの [クロス検証] タブで構成および表示できます。

    注意注意

    [マイニング精度チャート] タブは、タイム シリーズ モデルでは使用できません。

リフト チャート

リフト チャートには、データセットに存在する予測可能列の既知の値に対してテスト データセットから得た予測クエリの結果がプロットされます。このチャートには、マイニング モデルの結果の他に、理想的なモデルによって生成された結果と、ランダムな予測の結果が表されます。ランダムな線よりも向上しているものはリフトと呼ばれます。モデルのリフトが大きいほど、効果的なモデルとなります。リフト チャートでは、不連続の予測可能な属性を含むマイニング モデルのみを比較できます。

リフト チャートを作成するには、[入力の選択] タブを使用して対象のモデルを構成し、テスト データセットを選択します。その後、[リフト チャート] タブをクリックすると、完成したグラフが表示されます。

詳細情報 : リフト チャート (Analysis Services - データ マイニング), [マイニング精度チャート] タブ : 操作方法に関するトピック, モデルの精度をグラフ化するためのツール (Analysis Services - データ マイニング)

利益チャート

利益チャートは、リフト チャートの変種で、モデルによって生成された予測を使用する業務コストに関する情報が統合されています。郵送費用などのコストに関連する情報を入力すると、Analysis Services は、モデルによって提供されるリフトを示す曲線を表示し、モデルを使用した場合の投資に対する利益を計算します。

利益チャートを作成するには、[入力の選択] タブを使用して対象のモデルを構成し、テスト データセットを選択します。次に、[リフト チャート] タブをクリックし、[グラフの種類] ボックスの一覧から [利益チャート] を選択します。[利益チャートの設定] ダイアログ ボックスが自動的に開きます。利益チャートに固有のパラメータを構成すると、[マイニング精度チャート] タブに表示されるグラフが自動的に変更されて、単位あたりの損益が表示されます。

詳細情報 : 利益チャート (Analysis Services - データ マイニング), [利益チャートの設定] ダイアログ ボックス ([マイニング精度チャート] ビュー)

散布図

散布図は、それぞれのケースについて実際の値と予測された値とを比較して、連続する属性を予測するモデルの精度をグラフ化します。予測可能な属性に連続的な値が含まれる場合、リフト チャートの代わりに散布図が生成されます。

必要な予測可能列と入力列がモデルでサポートされていれば、データ マイニング デザイナの [マイニング精度チャート] タブで散布図を作成できます。まず、[入力の選択] タブを使用して対象のモデルを構成し、テスト データセットを選択します。その後、[リフト チャート] タブをクリックすると、[マイニング精度チャート] タブに表示されるグラフが自動的に変更されて、入力と予測された値の間の直線関係を示すグラフが表示されます。

詳細情報 : 散布図 (Analysis Services - データ マイニング)

分類マトリックス

分類マトリックスは、構造内のマイニング モデルによってどのぐらい正確に予測が作成されるかを確認するもう 1 つの手段です。分類マトリックスを作成する場合、Analysis Services では、テスト データセット内に存在する実際の値を使用して、良い予測と悪い予測の数を数えます。分類マトリックスは、モデルによって値が正しく予測された頻度だけでなく、モデルによって誤って予測された値も示されるので、非常に便利なツールです。分類マトリックスには、それぞれの予測可能な属性について、真陽性、偽陽性、真陰性、および偽陰性の値の実際の数が示されます。

分類マトリックスは、データ マイニング デザイナの [マイニング精度チャート] タブで作成できます。まず、[入力の選択] タブを使用して対象のモデルを構成し、テスト データセットを選択します。その後、[分類マトリックス] タブをクリックすると、分類マトリックスが自動的に表示されます。それ以上の構成は必要ありません。

詳細情報 :分類マトリックス (Analysis Services - データ マイニング)」、「[マイニング精度チャート] タブ : 操作方法に関するトピック」、「モデルの精度をグラフ化するためのツール (Analysis Services - データ マイニング)

クロス検証レポート

クロス検証は、モデルの有効性の測定に役立つ高度なデータ マイニング手法です。クロス検証レポートを作成すると、データセットが複数のセクションに分割され、それらのサブセットに対して複数のモデルが自動的に作成およびトレーニングされて、すべてのモデルの精度が計算されます。生成された統計を調べることで、異なるデータセットにわたってモデルが適切に一般化されているかどうかや、構造に対して複数ある中のどのモデルのパフォーマンスが最高であるかを判断できます。

クロス検証レポートは、データ マイニング デザイナの [マイニング精度チャート] タブで作成できます。まず、モデルまたは構造を選択します。次に、[クロス検証] タブを使用して、フォールドの数や対象の属性などのオプションを設定します。

詳細情報 : 相互検証 (Analysis Services - データ マイニング), クロス検証レポート (Analysis Services - データ マイニング)