予測モデルの検証 (中級者向けデータマイニングチュートリアル)

[アーティクル]
03/13/2017

対象: SQL Server 2016 Preview

使用して、結果を表示するには予測マイニングモデルを構築したら、これで、 マイニングモデルビューアー データマイニングデザイナーのタブをクリックします。 Microsoft タイムシリーズビューアーには、2 つのタブが含まれています: グラフと モデルします。

また、すべてのモデルで Microsoft 汎用ツリービューアーを使用できます。それぞれのビューに、時系列モデルの情報が少しずつ異なる方法で表示されます。

[グラフ] タブ
[モデル] タブ
Microsoft 汎用コンテンツビューアー

[グラフ] タブ

グラフ のタブ、 Microsoft タイムシリーズビューアーグラフィカルに表示する履歴データと予測を含むシリーズの各します。時系列グラフのそれぞれの線は、製品、地域、および予測可能な属性の一意の組み合わせを表します。

ビューアーの右側の凡例には、ドロップダウンリストでの選択に基づいて、選択可能なすべての時系列が表示されます。凡例で、これらのチェックボックスをオンまたはオフにして、グラフに表示する時系列を指定できます。

各時系列に対して使用する色などの表示オプション、またはグラフの点に値を表示するかどうかを変更することもできます。

時系列を選択するには

クリックして、 グラフ のタブ、 マイニングモデルビューアー ] タブが表示されない場合。
グラフビューの右側にあるドロップダウンリストをクリックし、すべてのチェックボックスをオンにします。 **[OK]**をクリックします。

グラフに 24 本の異なる系列線が表示されます。
グラフの右側にチェックボックス、量に基づくすべての系列の線を一時的に非表示にあるボックスをオフにします。

次に、R750 と R250 という自転車に関連するチェックボックスをオフにします。

これで、グラフに含まれる系列線は次の 6 つだけになるため、M200 と T1000 という自転車の傾向を比較しやすくなります。
- M200 Europe: Quantity
- M200 North America: Quantity
- M200 Pacific: Quantity
- T1000 Europe: Quantity
- T1000 North America: Quantity
- T1000 Pacific: Quantity

M200 および T1000 の数量を予測するシリーズ

このビューアーに表示されるグラフには、履歴データと予測データの両方が含まれます。履歴データと区別できるよう、予測データの部分は網掛けされています。個々の系列を比較しやすくするために、グラフのそれぞれの線に関連付けられている色を変更することもできます。詳細については、「データマイニングビューアーで使用する色の変更」を参照してください。

これらの傾向線からは、どの地域でも総売上がしだいに増加しており、12 か月目 (つまり 12 月) でピークに達していることがわかります。またグラフから、T1000 という自転車のデータが他の製品系列のデータより大幅に遅れて始まっていることもわかります。これは、この製品が新しい製品であるためです。この系列については、基になるデータが十分でないため、正確な予測が得られない可能性があります。

既定では、各時系列について、5 つの予測期間分の予測が点線で表示されます。この値を変更して、表示する予測を増減することもできます。グラフに誤差範囲を追加することで、その予測の標準偏差をグラフ形式で表示できます。

グラフビューの予測オプションと表示オプションを変更するには

値を変更してみてください 予測期間 、徐々に増やしてから 5 に 10, に戻ると 6します。

履歴データの変動幅が大きい場合は、予測の数を増やすと変動が繰り返される傾向にあり、増幅されることもあります。多くの場合、この時点である程度の調査が必要になります。この調査で、履歴データの大幅な増加の原因を特定し、それらの結果をそのまま使用するか、ソースデータに修正する箇所がないかどうかを探すか、モデルの線をいずれかの方法で滑らかにするかを判断することになります。
選択、 偏差の表示 チェックボックスをオンします。

このオプションをオンにすると、それぞれの予測値について、推定される誤差が表示されます。
X 軸のスケールを確認します。履歴データと予測データの変化はどちらも常に比率で表されますが、実際の値はグラフにすべての値が表示されるように自動的に調整されます。そのため、モデルを比較するときは、視覚的な見た目だけに頼らないように注意が必要です。正確な値、または増加率の予測の値と、点線または実線の上にマウスを置くまたは行の値を表示する] をクリックして、 マイニング凡例します。

ヒント:: 場合、 マイニング凡例 は表示されずに切り替える モデル ビュー、任意のノードを右クリックし、選択 凡例を表示するです。

これらの傾向を見て、一部の系列のデータが十分でないことが気になるときは、モデル別の売上の平均 (地域別の売上の平均など) を求めて予測の信頼性を高めることもできます。この方法については、このチュートリアルのレッスンで後ほど説明します。

トップに戻る

[モデル] タブ

モデル のタブ、 Microsoft データマイニングデザイナーでのタイムシリーズビューアーを使用して、ツリーグラフの形式で予測モデルを表示できます。

最初に注目する点は、ここで使用しているデータでは、複数の製品ライン (T1000 など) について、売上を示すメジャーがそれぞれ 2 つ (Amount と Quantity) あり、地域がそれぞれ 3 つ (ヨーロッパ、北米、および太平洋) に分かれているため、作成したモデルは実質的に 24 個のツリーで構成されているということです。それらの各ツリーが、地域、製品、および予測可能な属性の組み合わせがそれぞれ異なる売上パターンのモデルを表しています。

製品ライン、地域、および元の系列を選択して表示する販売のメトリックの組み合わせを選択することができます、 ツリー のドロップダウンリスト、 モデル ] タブをクリックします。

ここで、モデルをツリーとして表示すると何がわかるか考えてみましょう。ツリーに複数のレベルがあるモデルとノードが 1 つだけのモデルを例に、それらのモデルの違いについて考えてみます。

ツリーグラフのノードが 1 つだけの場合は、モデルで検出された傾向が時間の経過によってほとんど変化しないことを意味します。このというラベルが付いた 1 つのノードを使用する すべて, 、入力変数と結果の間のリレーションシップを表す式を表示します。
時系列のツリーグラフに複数の分岐がある場合は、検出された時系列が複雑すぎて、1 つの式では表せないことを意味します。複数の分岐、各分岐にツリーの原因となった条件ラベルが付いた代わりに、ツリーグラフを含めることが分割します。ツリーが分割されている場合、各分岐はそれぞれの時間の単位を表し、その時間単位ごとに 1 つの式で傾向を表すことができます。

たとえば、グラフのグラフを確認し、表示された 9 月に数回、年末休暇継続的に開始売り上げ高が急激に増加に切り替える、 モデル 傾向が変更されている正確な日付を表示するビュー。この場合、ツリー内の "9 月前" を表す分岐には分割前までの売上傾向を数学的に示す式、"9 月以降" を表す分岐には 9 月から年末休暇までの売上傾向を示す式のように、それぞれの分岐に異なる式が含まれます。

時系列モデルに対応するデシジョンツリーを調査するには

ツリー ボックスの一覧で、 モデル 、ビューアーのタブ、 T1000 Europe: 量 シリーズです。

というラベルが付いたノードをクリックして **すべて**です。  

 **すべて** ノードに表示されるツールヒントには、系列全体のケースの数などの情報が含まれていてから派生したられた時系列式のデータを分析します。

場合、 マイニング凡例 は表示されず、ノードを右クリックして 凡例を表示するです。

マイニング凡例 より、ツールヒントには、同じ情報を提供します。不連続な独立変数がある場合は、ノード内の変数の分布を示すヒストグラムも表示されます。
次に、別の時系列を選択して表示します。使用して、 ツリー ボックスの一覧で、 モデル 、ビューアーのタブ、 M200 North America: 量 シリーズです。

ツリーグラフが含まれ、 すべて ノードと 2 つの子ノードです。子ノードのラベルから、どの時点で傾向線が変化したか確認できます。

各子ノードでの説明、 マイニング凡例 、ツリーの各分岐のケースの数も含まれます。

ツリービューアーには、ほかにも次のような機能があります。

使用して、グラフに表示される変数を変更することができます、 バックグラウンド コントロールです。既定では、ノードが濃くなるためにが含まれる多くの場合の値 バックグラウンド に設定されている 母集団します。ケースの数がノードに含まれるだけを表示するノードの上にマウスを置くし、表示されたら、またはノードをクリックしで番号を表示するツールヒントを表示、 ノード凡例 ウィンドウです。
ツールヒントにはノードの回帰式も表示されます。これについても、ノードをクリックして確認することもできます。混合モデルを作成した場合は、ARIMA の式 (リーフノード内) と ARTXP の式 (ツリーのルートノード内) の 2 つが表示されます。
ノードでは、連続する数値が小さなひし形で表されます。属性の範囲は、そのひし形が示されたバーに表示されます。このひし形はノードの中間にあり、ひし形の幅がそのノードの属性の分散を表します。

トップに戻る

(オプション) 汎用コンテンツツリービューアー

タイムシリーズ用のカスタムビューアーだけでなく Analysis Services 提供、 MicrosoftGeneric コンテンツツリービューアー すべてのデータマイニングモデルを使用するためです。このビューアーには、次のような利点があります。

Microsoft タイムシリーズビューアー: このビューは、2 つのアルゴリズムの結果をマージします。各系列を別々に表示することもできますが、その場合、各アルゴリズムの結果がどのように結合されたかを判別できません。また、このビューでは、ツールチップと [マイニング凡例] に重要な統計情報だけが表示されます。
汎用コンテンツツリービューアー: 参照し、使用されていたデータ系列のすべてを同時に、モデル内に表示することができ、混合を作成した場合、ARIMA の両方をモデル化し、ARTXP ツリーは、同じグラフに表示します。

このビューアーを使用すると、両方のアルゴリズムからすべての統計情報を取得できるだけでなく、値の分布も確認できます。

ARIMA と ARTXP の分析について詳しく調べたい場合など、データマイニングの上級ユーザー向けのビューアーです。

汎用コンテンツビューアーで特定のデータ系列の詳細を表示するには

マイニングモデルビューアー ] タブで [ Microsoft 汎用コンテンツツリービューアー から、 ビューアー ボックスの一覧です。
ノードのキャプション ] ウィンドウで、最上位 (すべて)] ノードをクリックします。
ノードの詳細 ] ウィンドウで、ATTRIBUTE_NAME の値を表示します。

この値から、このノードにどの系列 (製品と地域の組み合わせ) が含まれているかがわかります。 AdventureWorks の例では、最上位ノードは M200 Europe 系列のノードです。

ノードのキャプション ] ウィンドウで、子ノードを持つ最初のノードを検索します。

系列のノードに子がある場合は、表示されるツリー ビュー、 **モデル** Microsoft タイム シリーズ ビューアーのタブには、分岐構造があります。

ノードを展開し、いずれかの子ノードをクリックします。

スキーマの NODE_DESCRIPTION 列に、ツリーが分割される原因になった条件が含まれています。
ノードのキャプション ] ウィンドウで、最上位の ARIMA ノードをクリックし、すべての子ノードが表示されるまでノードを展開します。
ノードの詳細 ] ウィンドウで、ATTRIBUTE_NAME の値を表示します。

この値から、このノードに含まれている時系列がわかります。 ARIMA セクションの最上位ノードは [(すべて)] セクションの最上位ノードと一致するはずです。 AdventureWorks の例では、このノードには M200 Europe 系列に対する ARIMA 分析が含まれています。

詳細については、「タイムシリーズモデルのマイニングモデルコンテンツ (Analysis Services - データマイニング)」を参照してください。

トップに戻る

このレッスンの次の作業

時系列予測 #40; 中級者向けデータマイニングチュートリアル ) を作成します。

参照

タイムシリーズモデルのクエリ例
 Microsoft タイムシリーズアルゴリズムテクニカルリファレンス

次の方法で共有

予測モデルの検証 (中級者向けデータマイニングチュートリアル)

[グラフ] タブ

時系列を選択するには

グラフビューの予測オプションと表示オプションを変更するには

[モデル] タブ

時系列モデルに対応するデシジョンツリーを調査するには

(オプション) 汎用コンテンツツリービューアー

汎用コンテンツビューアーで特定のデータ系列の詳細を表示するには

このレッスンの次の作業

参照

その他のリソース

次の方法で共有

予測モデルの検証 (中級者向けデータ マイニング チュートリアル)

[グラフ] タブ

時系列を選択するには

グラフ ビューの予測オプションと表示オプションを変更するには

[モデル] タブ

時系列モデルに対応するデシジョン ツリーを調査するには

(オプション) 汎用コンテンツ ツリー ビューアー

汎用コンテンツ ビューアーで特定のデータ系列の詳細を表示するには

このレッスンの次の作業

参照

その他のリソース

予測モデルの検証 (中級者向けデータマイニングチュートリアル)

グラフビューの予測オプションと表示オプションを変更するには

時系列モデルに対応するデシジョンツリーを調査するには

(オプション) 汎用コンテンツツリービューアー

汎用コンテンツビューアーで特定のデータ系列の詳細を表示するには