マーケット バスケット DMX のチュートリアル

新規 : 2005 年 12 月 5 日

このチュートリアルでは、データ マイニング拡張機能 (DMX) クエリ言語を使用して、マイニング モデルを作成、トレーニング、および調査する方法を学習します。その後、このマイニング モデルを使用して、同時に購入される傾向が高い製品を示す予測を作成します。

マイニング モデルは、AdventureWorksDW サンプル データベース内のデータから作成します。このサンプル データベースには、架空の企業 Adventure Works Cycles のデータが格納されています。Adventure Works Cycles は、多国籍の大規模な製造企業であり、北米、ヨーロッパ、およびアジアの市場向けに、金属製自転車や複合材製自転車の製造および販売を行っています。企業の拠点は従業員 290 人を擁する米国ワシントン州ボセルで、また各国の市場の拠点として、複数の地域販売チームが配置されています。AdventureWorksDW サンプル データベースの詳細については、「AdventureWorks サンプル データ ウェアハウス」を参照してください。

チュートリアルのシナリオ

Adventure Works Cycles は、データ マイニング機能を用いたカスタム アプリケーションを作成して、同時に購入する傾向が高い製品の種類を予測することにしました。このカスタム アプリケーションの目標は、一連の製品を指定できるようにし、指定した製品と共に購入される追加製品を予測できるようにすることです。Adventure Works Cycles はこれらの情報を使用して、企業の Web サイトでお勧めの製品を表示すると共に、顧客によりわかりやすく情報を表示したいと考えています。

Microsoft SQL Server 2005 Analysis Services (SSAS) に用意されているいくつかのツールを使用すると、上記の作業を実行できます。

Analysis Services で提供されるデータ マイニング拡張機能 (DMX) は、マイニング モデルの作成と作業に使用できるクエリ言語です。Microsoft アソシエーション アルゴリズムを使用すると、まとめて購入される可能性が高い製品を予測するモデルを作成できます。

このチュートリアルの目標は、カスタム アプリケーションで使用する DMX クエリを設定することです。

詳細については、データ マイニングの操作」を参照してください。

マイニング構造とマイニング モデル

DMX ステートメントを作成するにあたっては、Analysis Services がマイニング モデルの作成に使用する主なオブジェクトを理解しておくことが重要です。マイニング構造は、マイニング モデルの作成元のデータ ドメインを定義するデータ構造です。1 つのマイニング構造には、同じドメインを共有する複数のマイニング モデルを含めることができます。マイニング モデルは、マイニング構造によって表されるデータにマイニング モデル アルゴリズムを適用します。

マイニング構造の構成要素は、データ ソースに格納されているデータについて記述したマイニング構造列です。マイニング構造列には、データ型、コンテンツの種類、データの配布方法などの情報が格納されます。

マイニング モデルには、マイニング構造で記述されたキー列と、残りの列のサブセットが含まれる必要があります。マイニング モデルでは、各列の使用法と、マイニング モデルの作成に使用するアルゴリズムを定義します。たとえば、DMX では列がキー列または PREDICT 列であることを指定できます。指定されない列は入力列として扱われます。

DMX でマイニング モデルを作成するには、2 つの方法があります。1 つは、CREATE MINING MODEL ステートメントを使用して、マイニング構造とそれに関連するマイニング モデルを一度に作成する方法です。もう 1 つは、最初に CREATE MINING STRUCTURE ステートメントを使用してマイニング構造を作成し、ALTER STRUCTURE ステートメントを使用してマイニング モデルを追加する方法です。これらの方法について次に説明します。

  • CREATE MINING MODEL
    このステートメントを使用すると、マイニング構造とそれに関連するマイニング モデルを一度に、同じ名前を使って作成できます。マイニング構造と区別するため、マイニング モデルの名前には "Structure" という文字列が付加されます。このステートメントは、1 つのマイニング モデルを含むマイニング構造を作成する場合に便利です。

    詳細については、「CREATE MINING MODEL (DMX)」を参照してください。

  • ALTER MINING STRUCTURE
    このステートメントを使用すると、サーバー上に既に存在するマイニング構造にマイニング モデルを追加できます。このステートメントは、複数の異なるマイニング モデルを含むマイニング構造を作成する場合に便利です。1 つのマイニング構造に複数のマイニング モデルを追加すると、いくつかの作業に役立ちます。たとえば、異なるアルゴリズムを使用して複数のマイニング モデルを作成し、最適なアルゴリズムを見つけ出すことができます。また、同じアルゴリズムでそれぞれ異なるパラメータを設定して複数のマイニング モデルを作成し、パラメータの最適な設定を見つけ出すことができます。

    詳細については、「ALTER MINING STRUCTURE (DMX)」を参照してください。

このチュートリアルでは複数のマイニング モデルを含むマイニング構造を作成します。したがって、2 つ目の方法を使用します。

詳細情報

データ マイニング拡張機能 (DMX) リファレンス」、「選択ステートメント (DMX) について」、「予測クエリ (DMX)

学習する内容

このチュートリアルは次のレッスンで構成されています。

必要条件

このチュートリアルを行う前に、次のソフトウェアがインストールされていることを確認してください。

ms345326.note(ja-jp,SQL.90).gifメモ :
チュートリアルを行うときは、ドキュメント ビューアのツール バーに [次のトピック] ボタンと [前のトピック] ボタンを追加することをお勧めします。詳細については、「ヘルプへの [次のトピック] ボタンと [前のトピック] ボタンの追加」を参照してください。

参照

概念

Bike Buyer DMX のチュートリアル
データ マイニングのチュートリアル

その他の技術情報

データ マイニングの概念

ヘルプおよび情報

SQL Server 2005 の参考資料の入手