レッスン 1: Bike Buyer マイニング構造の作成
このレッスンでは、Adventure Works Cycles の潜在顧客が自転車を購入するかどうかを予測するためのマイニング構造を作成します。マイニング構造と、データ マイニングにおけるマイニング構造の役割については、「マイニング構造 (Analysis Services - データ マイニング)」を参照してください。
このレッスンで作成する Bike Buyer マイニング構造には、Microsoft クラスタリング アルゴリズムと Microsoft デシジョン ツリー アルゴリズムに基づくマイニング モデルを追加できます。後のレッスンでは、クラスタ マイニング モデルを使用して顧客をグループ化するさまざまな方法を確認し、デシジョン ツリー マイニング モデルを使用して潜在顧客が自転車を購入するかどうかを予測します。
CREATE MINING STRUCTURE ステートメント
マイニング構造を作成するには、CREATE MINING STRUCTURE (DMX) ステートメントを使用します。ステートメントのコードは次の部分に分けられます。
構造の名前指定
キー列の定義
マイニング列の定義
省略可能なテスト データセットの定義
CREATE MINING STRUCTURE ステートメントの汎用例を次に示します。
CREATE MINING STRUCTURE [<mining structure name>]
(
<key column>,
<mining structure columns>
)
WITH HOLDOUT (<holdout specifier>)
コードの 1 行目では、構造の名前を定義します。
CREATE MINING STRUCTURE [<mining structure name>]
データ マイニング拡張機能 (DMX) でオブジェクトに名前を付ける方法については、「識別子 (DMX)」を参照してください。
コードの次の行では、マイニング構造のキー列を定義します。キー列は、ソース データ内のエンティティを一意に識別します。
<key column>,
作成するマイニング構造では、顧客の識別子 CustomerKey でソース データ内のエンティティが定義されます。
その次の行では、マイニング構造に関連付けられたマイニング モデルで使用される、マイニング列を定義します。
<mining structure columns>
<mining structure columns> 内で DISCRETIZE 関数を使用して、次の構文で連続列を分離できます。
DISCRETIZE(<method>,<number of buckets>)
列の分離の詳細については、「分離メソッド (データ マイニング)」を参照してください。定義できるマイニング構造列の種類の詳細については、「マイニング構造列」を参照してください。
コードの最後の行では、マイニング構造の省略可能なパーティションを定義します。
WITH HOLDOUT (<holdout specifier>)
構造に関連するマイニング モデルのテストに使用するためにデータの一部を指定し、残りのデータはモデルのトレーニングに使用します。既定では、Analysis Services によって、全ケース データの 30% から成るテスト データセットが作成されます。テスト データセットがケースの 30% になるように指定を追加します (最大 1000 ケース)。ケースの 30% が 1000 より小さい場合、テスト データセットの量はもっと少なくなります。
このレッスンの作業
このレッスンでは、次の作業を行います。
新しい空のクエリの作成
マイニング構造を作成するためのクエリの変更
クエリの実行
クエリの作成
最初の手順では、SQL Server Management Studio で、Analysis Services のインスタンスに接続して新しい DMX クエリを作成します。
SQL Server Management Studio で新しい DMX クエリを作成するには
SQL Server Management Studio を開きます。
[サーバーへの接続] ダイアログ ボックスで、[サーバーの種類] の [Analysis Services] を選択します。[サーバー名] に、「LocalHost」と入力するか、このレッスンで接続する Analysis Services のインスタンスの名前を入力して、[接続] をクリックします。
オブジェクト エクスプローラで Analysis Services のインスタンスを右クリックし、[新しいクエリ] をポイントして [DMX] をクリックすると、クエリ エディタが開き、新しい空のクエリが表示されます。
クエリの変更
次の手順では、上の CREATE MINING STRUCTURE ステートメントを変更し、Bike Buyer マイニング構造を作成します。
CREATE MINING STRUCTURE ステートメントをカスタマイズするには
クエリ エディタで、CREATE MINING STRUCTURE ステートメントの汎用例を空のクエリにコピーします。
次の部分を探します。
[<mining structure>]
これを次の文字列に置き換えます。
[Bike Buyer]
次の部分を探します。
<key column>
これを次の文字列に置き換えます。
CustomerKey LONG KEY
次の部分を探します。
<mining structure columns>
これを次の文字列に置き換えます。
[Age] LONG DISCRETIZED(Automatic,10), [Bike Buyer] LONG DISCRETE, [Commute Distance] TEXT DISCRETE, [Education] TEXT DISCRETE, [Gender] TEXT DISCRETE, [House Owner Flag] TEXT DISCRETE, [Marital Status] TEXT DISCRETE, [Number Cars Owned] LONG DISCRETE, [Number Children At Home] LONG DISCRETE, [Occupation] TEXT DISCRETE, [Region] TEXT DISCRETE, [Total Children]LONG DISCRETE, [Yearly Income] DOUBLE CONTINUOUS
次の部分を探します。
WITH HOLDOUT (holdout specifier>)
これを次の文字列に置き換えます。
WITH HOLDOUT (30 PERCENT or 1000 CASES)
最終的なマイニング構造のステートメントは次のようになります。
CREATE MINING STRUCTURE [Bike Buyer] ( [Customer Key] LONG KEY, [Age]LONG DISCRETIZED(Automatic,10), [Bike Buyer] LONG DISCRETE, [Commute Distance] TEXT DISCRETE, [Education] TEXT DISCRETE, [Gender] TEXT DISCRETE, [House Owner Flag] TEXT DISCRETE, [Marital Status] TEXT DISCRETE, [Number Cars Owned]LONG DISCRETE, [Number Children At Home]LONG DISCRETE, [Occupation] TEXT DISCRETE, [Region] TEXT DISCRETE, [Total Children]LONG DISCRETE, [Yearly Income] DOUBLE CONTINUOUS ) WITH HOLDOUT (30 PERCENT or 1000 CASES)
[ファイル] メニューで、[名前を付けて DMXQuery1.dmx を保存] をクリックします。
[名前を付けて保存] ダイアログ ボックスで、適切なフォルダを参照して指定し、ファイルに「Bike Buyer Structure.dmx」という名前を付けます。
クエリの実行
最後の手順では、クエリを実行します。クエリを作成して保存したら、そのクエリを実行する必要があります。つまり、サーバーでマイニング構造を作成するには、ステートメントを実行する必要があります。クエリ エディタでのクエリの実行の詳細については、「SQL Server Management Studio データベース エンジン クエリ エディタ ウィンドウ」を参照してください。
クエリを実行するには
クエリ エディタのツール バーで、[実行] をクリックします。
ステートメントの実行完了後、クエリ エディタ下部の [メッセージ] タブにクエリの状態が表示されます。この場合次のメッセージが表示されます。
Executing the query Execution complete
これで、Bike Buyer という名前の新しい構造が、サーバー上に作成されました。
次のレッスンでは、作成した構造にマイニング モデルを追加します。