Bike Buyer DMX のチュートリアル

このチュートリアルでは、データ マイニング拡張機能 (DMX) クエリ言語を使用して、マイニング モデルを作成、トレーニング、および調査する方法を学習します。その後、これらのマイニング モデルを使用して、顧客が自転車を購入するかどうかを判断する予測を作成します。

マイニング モデルは、AdventureWorksDW2008R2 サンプル データベース内のデータから作成します。このサンプル データベースには、架空の企業である Adventure Works Cycles のデータが格納されています。Adventure Works Cycles は、多国籍の大規模な製造企業であり、北米、ヨーロッパ、およびアジアの市場向けに、金属製自転車や複合材製自転車の製造および販売を行っています。企業の拠点は従業員 290 人を擁する米国ワシントン州ボセルで、また各国の市場の拠点として、複数の地域販売チームが配置されています。AdventureWorksDW2008R2 サンプル データベースの詳細については、「AdventureWorks サンプル データ ウェアハウス」を参照してください。

チュートリアルのシナリオ

Adventure Works Cycles は、データ マイニング機能を用いたカスタム アプリケーションを作成して、データ分析を拡張することにしました。このカスタム アプリケーションでは、次の機能を実現することを目標にします。

  • 潜在顧客の特性を入力し、潜在顧客が自転車を購入するかどうかを予測する。

  • 特性の他に潜在顧客の一覧も入力し、どの顧客が自転車を購入するかを予測する。

1 つ目のケースでは、顧客登録ページから顧客データを取得し、2 つ目のケースでは、Adventure Works Cycles のマーケティング部門が潜在顧客の一覧を提供するようにします。

マーケティング部門には、さらに住所、子どもの数、通勤距離などの特性に基づいて既存の顧客を分類するという要求が出されています。この分類を使用して、特定の種類の顧客に的を絞ることができるかどうか確認することが求められています。これには、追加のマイニング モデルが必要です。

Microsoft SQL Server Analysis Services に用意されているいくつかのツールを使用すると、上記の作業を実行できます。

Analysis Services で提供されるデータ マイニング拡張機能 (DMX) は、マイニング モデルの作成と作業に使用できるクエリ言語です。Microsoft デシジョン ツリー アルゴリズムを使用すると、顧客が自転車を購入するかどうかの予測に使用できるモデルを作成できます。作成したモデルには、個別の顧客または複数の顧客のテーブルを入力できます。Microsoft クラスタリング アルゴリズムを使用すると、共通の特性に基づいて顧客のグループを作成できます。このチュートリアルの目標は、カスタム アプリケーションで使用する DMX スクリプトを設定することです。

詳細については、データ マイニング プロジェクト (Analysis Services - データ マイニング)」を参照してください。

マイニング構造とマイニング モデル

DMX ステートメントを作成するにあたっては、Analysis Services がマイニング モデルの作成に使用する主なオブジェクトを理解しておくことが重要です。マイニング構造は、マイニング モデルの作成元のデータ ドメインを定義するデータ構造です。1 つのマイニング構造には、同じドメインを共有する複数のマイニング モデルを含めることができます。マイニング モデルは、マイニング構造によって表されるデータにマイニング モデル アルゴリズムを適用します。

マイニング構造の構成要素は、データ ソースに格納されているデータについて記述したマイニング構造列です。マイニング構造列には、データ型、コンテンツの種類、データの配布方法などの情報が格納されます。

マイニング モデルには、マイニング構造で記述されたキー列と、残りの列のサブセットが含まれる必要があります。マイニング モデルでは、各列の使用法と、マイニング モデルの作成に使用するアルゴリズムを定義します。たとえば、DMX では列がキー列または PREDICT 列であることを指定できます。指定されない列は入力列として扱われます。

DMX でマイニング モデルを作成するには、2 つの方法があります。1 つは、CREATE MINING MODEL ステートメントを使用して、マイニング構造とそれに関連するマイニング モデルを一度に作成する方法です。もう 1 つは、最初に CREATE MINING STRUCTURE ステートメントを使用してマイニング構造を作成し、ALTER STRUCTURE ステートメントを使用してマイニング モデルを追加する方法です。次の表でこれらの方法について説明します。

  • CREATE MINING MODEL
    このステートメントを使用すると、マイニング構造とそれに関連するマイニング モデルを一度に、同じ名前を使って作成できます。マイニング構造と区別するため、マイニング モデルの名前には "Structure" という文字列が付加されます。このステートメントは、1 つのマイニング モデルを含むマイニング構造を作成する場合に便利です。

    詳細については、「CREATE MINING MODEL (DMX)」を参照してください。

  • ALTER MINING STRUCTURE
    このステートメントを使用すると、サーバー上に既に存在するマイニング構造にマイニング モデルを追加できます。このステートメントは、複数の異なるマイニング モデルを含むマイニング構造を作成する場合に便利です。1 つのマイニング構造に複数のマイニング モデルを追加すると、いくつかの作業に役立ちます。たとえば、異なるアルゴリズムを使用する複数のマイニング モデルを作成し、最適なアルゴリズムを見つけ出すことができます。また、同じアルゴリズムでそれぞれ異なるパラメーターを設定して複数のマイニング モデルを作成し、パラメーターの最適な設定を見つけ出すことができます。

    詳細については、「ALTER MINING STRUCTURE (DMX)」を参照してください。

このチュートリアルでは複数のマイニング モデルを含むマイニング構造を作成します。したがって、2 つ目の方法を使用します。

詳細については、次を参照してください。

データ マイニング拡張機能 (DMX) リファレンス, 選択ステートメント (DMX) について, 予測クエリ (DMX)

学習する内容

このチュートリアルは次のレッスンで構成されています。

必要条件

このチュートリアルを行う前に、次のソフトウェアがインストールされていることを確認してください。

  • Microsoft SQL Server 

  • Microsoft SQL Server 2005 Analysis Services (SSAS)、SQL Server 2008 Analysis Services (SSAS)、または SQL Server Analysis Services 

  • AdventureWorksDW2008R2 データベース。セキュリティ強化のため、既定ではサンプル データベースがインストールされません。Microsoft SQL Server の公式サンプル データベースをインストールするには、Microsoft SQL Sample Databases ページにアクセスし、インストールするデータベースを選択してください。 このサンプル データベースのインストール方法の詳細については、「最初のインストール (Analysis Services)」を参照してください。

注意

チュートリアルを行うときは、ドキュメント ビューアーのツール バーに [次のトピック] ボタンと [前のトピック] ボタンを追加することをお勧めします。詳細については、「ヘルプへの [次のトピック] ボタンと [前のトピック] ボタンの追加」を参照してください。