[アーティクル]
04/01/2012

データマイニングアルゴリズム (Analysis Services - データマイニング)

データマイニングアルゴリズムは、データマイニングモデルを作成するメカニズムです。モデルを作成するために、データマイニングアルゴリズムは、まず一連のデータを分析し、特定のパターンおよび傾向を探します。この分析の結果は、マイニングモデルのパラメータを定義するために使用されます。これらのパラメータはデータセット全体に適用され、実用的なパターンおよび詳細な統計情報が抽出されます。

アルゴリズムによって作成されるマイニングモデルは、次のようにさまざまな形式を取ります。

トランザクションで製品をグループ化する方法を説明するルールのセット
特定の顧客が製品を購入するかどうかを予測するデシジョンツリー
売上を予想する数学的モデル
データセット内のケースの関係を説明するクラスタのセット

Microsoft SQL Server Analysis Services には、データマイニングソリューションで使用できるいくつかのアルゴリズムが用意されています。これらのアルゴリズムは、データマイニングに使用できるすべてのアルゴリズムのサブセットです。また、OLE DB for Data Mining 仕様に準拠したサードパーティのアルゴリズムを使用することもできます。サードパーティのアルゴリズムの詳細については、「プラグインアルゴリズム」を参照してください。

データマイニングアルゴリズムの種類

Analysis Services には、次の種類のアルゴリズムが含まれます。

分類アルゴリズムは、データセット内の他の属性に基づいて、1 つまたは複数の離散変数を予測します。分類アルゴリズムの例としては、Microsoft デシジョンツリーアルゴリズムがあります。
回帰アルゴリズムは、データセット内の他の属性に基づいて、利益や損失などの 1 つまたは複数の連続変数を予測します。回帰アルゴリズムの例としては、Microsoft タイムシリーズアルゴリズムがあります。
分割アルゴリズムは、データを類似したプロパティを持つアイテムのグループまたはクラスタに分割します。分割アルゴリズムの例としては、Microsoft クラスタリングアルゴリズムがあります。
アソシエーションアルゴリズムは、データセット内の異なる属性間の相関関係を検出します。この種類のアルゴリズムの最も一般的な使用例は、マーケットバスケット分析で使用するアソシエーションルールの作成です。アソシエーションアルゴリズムの例としては、Microsoft アソシエーションアルゴリズムがあります。
シーケンス分析アルゴリズムは、Web パスフローなど、データ内の頻度の高いシーケンスまたはエピソードを要約します。シーケンス分析アルゴリズムの例としては、Microsoft シーケンスクラスターアルゴリズムがあります。

アルゴリズムの適用

特定のビジネスタスクに使用する最適なアルゴリズムを選択するのが困難な場合があります。異なるアルゴリズムを使用して同じビジネスタスクを実行できる一方、各アルゴリズムによって異なる結果が生成されたり、一部のアルゴリズムでは複数の種類の結果が生成されたりする場合があります。たとえば、Microsoft デシジョンツリーアルゴリズムは、予測だけでなく、データセット内の列の数を減らす方法としても使用できます。これは、デシジョンツリーが、最終的なマイニングモデルに影響を与えない列を識別できるためです。

また、アルゴリズムを別々に使用する必要はありません。つまり、単一のデータマイニングソリューションで、いくつかのアルゴリズムを使用してデータを調べ、その後に別のアルゴリズムでそのデータに基づいて特定の結果を予測することができます。たとえば、パターンを認識するクラスタリングアルゴリズムを使用して、データをある程度均一性のあるグループに分割し、その結果を使用してより精度の高いデシジョンツリーモデルを作成できます。1 つのソリューション内で複数のアルゴリズムを使用して、個別のタスクを実行することもできます。たとえば、回帰ツリーアルゴリズムを使用して財務予測情報を取得し、ルールベースアルゴリズムを使用してマーケットバスケット分析を実行する場合などです。

マイニングモデルでは、値の予測、データの要約の生成、隠れた相関関係の検出を行うことができます。データマイニングソリューションで使用するアルゴリズムの選択の参考として、特定のタスクに推奨されるアルゴリズムを次の表に示します。

タスク	使用する Microsoft アルゴリズム
不連続属性の予測。たとえば、ターゲットメーリングキャンペーンの受け取り人が製品を購入するかどうかを予測します。	Microsoft デシジョンツリーアルゴリズム Microsoft Naive Bayes アルゴリズム Microsoft クラスタリングアルゴリズム Microsoft ニューラルネットワークアルゴリズム (Analysis Services - データマイニング)
連続属性の予測。たとえば、来年の売上を予測します。	Microsoft デシジョンツリーアルゴリズム Microsoft タイムシリーズアルゴリズム
シーケンスの予測。たとえば、企業の Web サイトのクリックストリーム分析を実行します。	Microsoft シーケンスクラスターアルゴリズム
トランザクション内の共通アイテムのグループの検出。たとえば、マーケットバスケット分析を使用して顧客に他の商品の購入を勧めます。	Microsoft アソシエーションアルゴリズム Microsoft デシジョンツリーアルゴリズム
類似アイテムのグループの検出。たとえば、属性間のリレーションシップをよりわかりやすくするために人口統計情報データをグループに分割します。	Microsoft クラスタリングアルゴリズム Microsoft シーケンスクラスターアルゴリズム

不連続属性の予測。

たとえば、ターゲットメーリングキャンペーンの受け取り人が製品を購入するかどうかを予測します。

Microsoft デシジョンツリーアルゴリズム

Microsoft Naive Bayes アルゴリズム

Microsoft クラスタリングアルゴリズム

Microsoft ニューラルネットワークアルゴリズム (Analysis Services - データマイニング)

連続属性の予測。

たとえば、来年の売上を予測します。

Microsoft デシジョンツリーアルゴリズム

Microsoft タイムシリーズアルゴリズム

シーケンスの予測。

たとえば、企業の Web サイトのクリックストリーム分析を実行します。

Microsoft シーケンスクラスターアルゴリズム

トランザクション内の共通アイテムのグループの検出。

たとえば、マーケットバスケット分析を使用して顧客に他の商品の購入を勧めます。

Microsoft アソシエーションアルゴリズム

Microsoft デシジョンツリーアルゴリズム

類似アイテムのグループの検出。

たとえば、属性間のリレーションシップをよりわかりやすくするために人口統計情報データをグループに分割します。

Microsoft クラスタリングアルゴリズム

Microsoft シーケンスクラスターアルゴリズム

各モデルによって異なる種類の結果が返されるため、Analysis Services ではアルゴリズムごとに個別のビューアが用意されています。Analysis Services でマイニングモデルを参照すると、そのモデルに適したビューアを使用してデータマイニングデザイナの [マイニングモデルビューア] タブにモデルが表示されます。詳細については、「データマイニングモデルの表示」を参照してください。

アルゴリズムの詳細

次の表に、各アルゴリズムで使用できる情報の種類へのリンクを示します。

基本的なアルゴリズムの説明 アルゴリズムの内容や機能について、そのアルゴリズムが有用なビジネスシナリオと共に基本的な説明を行います。
テクニカルリファレンス アルゴリズムの動作を制御したり、モデルの結果をカスタマイズしたりできるパラメータを一覧表示します。アルゴリズムの実装、パフォーマンスのヒント、およびデータの要件に関する詳しい技術的な説明が含まれています。
モデルのクエリ 使用できるクエリの例がモデルの種類ごとに紹介されています。モデルのクエリを実行すると、モデルのパターンの詳細を調べたり、それらのパターンに基づいて予測を行うことができます。
マイニングモデルコンテンツ モデルの種類ごとに情報が共通の構造にどのように格納されるか、およびその情報を解釈する方法について説明します。モデルを作成できたら、BI Development Studio に用意されているビューアを使用してモデルを調べたり、DMX を使用して、直接モデルコンテンツから情報を取得するクエリを記述したりすることができます。

基本的なアルゴリズムの説明	テクニカルリファレンス	クエリ	マイニングモデルコンテンツ
Microsoft アソシエーションアルゴリズム	Microsoft アソシエーションアルゴリズムテクニカルリファレンス-	アソシエーションモデルのクエリ (Analysis Services - データマイニング)	アソシエーションモデルのマイニングモデルコンテンツ (Analysis Services - データマイニング)
Microsoft クラスタリングアルゴリズム	Microsoft クラスタリングアルゴリズムテクニカルリファレンス	クラスターモデルのクエリ (Analysis Services - データマイニング)	クラスタモデルのマイニングモデルコンテンツ (Analysis Services - データマイニング)
Microsoft デシジョンツリーアルゴリズム	Microsoft デシジョンツリーアルゴリズムテクニカルリファレンス	デシジョンツリーモデルのクエリ (Analysis Services - データマイニング)	デシジョンツリーモデルのマイニングモデルコンテンツ (Analysis Services - データマイニング)
Microsoft 線形回帰アルゴリズム	Microsoft 線形回帰アルゴリズムテクニカルリファレンス	線形回帰モデルのクエリ (Analysis Services - データマイニング)	線形回帰モデルのマイニングモデルコンテンツ (Analysis Services - データマイニング)
Microsoft ロジスティック回帰アルゴリズム	Microsoft ロジスティック回帰アルゴリズムテクニカルリファレンス	ロジスティック回帰モデルの照会 (Analysis Services - データマイニング)	ロジスティック回帰モデルのマイニングモデルコンテンツ (Analysis Services - データマイニング)
Microsoft Naive Bayes アルゴリズム	Microsoft Naive Bayes アルゴリズムテクニカルリファレンス	Naive Bayes モデルのクエリ (Analysis Services - データマイニング)	Naive Bayes モデルのマイニングモデルコンテンツ (Analysis Services - データマイニング)
Microsoft ニューラルネットワークアルゴリズム (Analysis Services - データマイニング)	Microsoft ニューラルネットワークアルゴリズムテクニカルリファレンス	ニューラルネットワークモデルのクエリ (Analysis Services - データマイニング)	ニューラルネットワークモデルのマイニングモデルコンテンツ (Analysis Services - データマイニング)
Microsoft シーケンスクラスターアルゴリズム	Microsoft シーケンスクラスタアルゴリズムテクニカルリファレンス (Analysis Services - データマイニング)	シーケンスクラスターモデルのクエリ (Analysis Services - データマイニング)	シーケンスクラスターモデルのマイニングモデルコンテンツ (Analysis Services - データマイニング)
Microsoft タイムシリーズアルゴリズム	Microsoft タイムシリーズアルゴリズムテクニカルリファレンス	タイムシリーズモデルのクエリ (Analysis Services - データマイニング)	タイムシリーズモデルのマイニングモデルコンテンツ (Analysis Services - データマイニング)

次の方法で共有

データマイニングアルゴリズム (Analysis Services - データマイニング)

データマイニングアルゴリズムの種類

アルゴリズムの適用

アルゴリズムの詳細

関連項目

参照

概念

その他のリソース

次の方法で共有

データ マイニング アルゴリズム (Analysis Services - データ マイニング)

データ マイニング アルゴリズムの種類

アルゴリズムの適用

アルゴリズムの詳細

関連項目

参照

概念

その他のリソース

データマイニングアルゴリズム (Analysis Services - データマイニング)

データマイニングアルゴリズムの種類