基本的なデータ マイニング チュートリアル

 

対象: SQL Server 2016 Preview

へようこそ、 Microsoft Analysis Services 基本的なデータ マイニングのチュートリアルです。 Microsoft SQL Server データ マイニング モデルを作成し、予測を行うのための統合環境を提供します。 このチュートリアルでは、機械学習を分析および顧客の購買行動を予測を使用するターゲット メーリング キャンペーンのシナリオを完了します。 このチュートリアルでは、クラスタリング、デシジョン ツリー、Naive Bayes (ナイーブ ベイズ) という非常に重要な 3 つのデータ マイニング アルゴリズムを使用する方法を示します。 マイニング モデル ビューアーを使用して見解を分析し、予測および精度チャートに含まれているデータ マイニング ツールを使用して作成する方法も学習 Microsoft SQL Server Analysis Servicesします。 すべての例で、架空の企業である Adventure Works Cycles を使用します。

完了させることをお勧めデータ マイニング ツールを使い慣れてできたら、 中級者向けデータ マイニングのチュートリアルと #40 です。Analysis Services - データ マイニング )します。 これらのレッスンでは、予測、マーケット バスケット分析、タイム シリーズ (時系列)、アソシエーション モデル、入れ子になったテーブル、およびシーケンス クラスターの使用方法を示します。

チュートリアルのシナリオ

このチュートリアルでは、従業員は Adventure Works Cycles 命じられた購買履歴に基づいて会社の顧客の詳細と、その履歴データを使用して、マーケティングで使用できる予測を作成します。 会社はこれまでデータ マイニングを行ったことがなかったので、データ マイニング専用の新しいデータベースを作成し、データ マイニング モデルを設定する必要があります。

学習する内容

このチュートリアルでは、さまざまな種類の機械学習メソッドの作成方法と使用方法を説明します。 また、マイニング モデルのコピーを作成し、入力データにフィルターを適用してさまざまな結果を取得する方法も学習します。 その後、リフト チャートを使用して、両方のモデルの結果を比較できます。 最後に、ドリルスルーを使用して、基になるマイニング構造から詳細なデータを取得します。

Microsoft Analysis Services データ マイニングには、次が含まれています。 簡単にできるようにする機能と開発および複数の予測モデルを比較し、結果に対する操作の実行。

  • 提示されたテスト セットにトレーニング セットとテスト セットにマイニング構造内のデータを分割できるようになりましたマイニング構造を作成するとき。 これにより、類似のデータ セットに対してモデルをテストし、関連するモデルの精度を比較できます。

  • マイニング モデルのフィルター -フィルターをマイニング モデルにアタッチし、トレーニングとテストの両方にフィルターを適用できます。 これにより、データの異なるサブセットに対して関連モデルを簡単に構築できます。

  • 構造ケースおよび構造列へのドリルスルー 行うことができます今すぐ簡単にマイニング モデルの一般的なパターンからデータ ソースの実用的な詳細です。

このチュートリアルは次のレッスンで構成されています。

レッスン 1: Analysis Services データベースと #40; の準備基本的なデータ マイニングのチュートリアルと #41 です。
このレッスンでは、新しい Analysis Services データベースを作成する方法、データ ソースとデータ ソース ビューを追加する方法、およびデータ マイニングで使用する新しいデータベースを準備する方法を学習します。

レッスン 2: 絞り込みメール構造と #40; の作成基本的なデータ マイニングのチュートリアルと #41 です。
このレッスンでは、絞り込みメール配信シナリオの一部として使用できるマイニング モデル構造の作成方法を学習します。

レッスン 3: モデルの追加と処理
このレッスンでは、構造にモデルを追加する方法を学習します。 モデルの作成には、次のアルゴリズムを使用します。

  • Microsoft デシジョン ツリー

  • Microsoft クラスター

  • Microsoft Naive Bayes

レッスン 4: 絞り込みモデルと #40; の検証基本的なデータ マイニングのチュートリアルと #41 です。
このレッスンでは、ビューアーを使用して各モデルの結果を調査および解釈する方法を学習します。

レッスン 5: テストのモデルと #40 です。基本的なデータ マイニングのチュートリアルと #41 です。
このレッスンでは、いずれかの絞り込みメール配信モデルのコピーを作成し、トレーニング データを制限するためのマイニング モデル フィルターを特定の顧客のセットに追加し、モデルの実行可能性を評価します。

レッスン 6: 予測の作成と操作 (基本的なデータ マイニング チュートリアル)
「基本的なデータ マイニング チュートリアル」の最後のレッスンでは、モデルを使用して、自転車を購入する可能性が最も高い顧客を予測します。 次に、基になるケースをドリルスルーして連絡先情報を取得します。

必要条件

次のソフトウェアがインストールされていることを確認してください。

  • Microsoft SQL Server 2016

  • Microsoft SQL Server Analysis Services 多次元モードで

  • AdventureWorksDW2012 データベース。

セキュリティ強化のため、サンプル データベースは SQL Server と一緒にインストールされません。 公式データベースをインストールする Microsoft SQL Server, を参照してください、 Microsoft SQL Sample Databases ページをオンに SQL Server 2016します。

参照

データ マイニング ソリューション
マイニング モデル タスクと操作方法
DMX を使用したデータ マイニング モデルの作成とクエリ : チュートリアル (Analysis Services - データ マイニング)