データマイニングクエリ

[アーティクル]
07/30/2013

データマイニングクエリは多くの目的で役立ちます。次の操作を実行できます。

モデルを新しいデータに適用し、1 つまたは複数の予測を作成する。入力値をパラメーターとして、またはバッチで提供する。
トレーニングに使用したデータの統計サマリーを取得する。
パターンとルールを抽出する、またはモデル内のパターンを表現する代表的なケースのプロファイルを生成する。
回帰式と、パターンを説明する他の計算を抽出する。
特定のパターンに適合するケースを取得する。
分析で使用されないデータも含め、モデルで使用された個々のケースに関する詳細を取得する。
新しいデータの追加、またはクロス予測の実行によりモデルを再トレーニングする。

ここでは、最初に知っておく必要があるデータマイニングクエリの概要を説明します。データマイニングオブジェクトに対して作成できるクエリの種類を示して、クエリツールおよびクエリ言語について説明します。また、SQL Server データマイニングで提供されるアルゴリズムを使用してビルドしたモデルに対して作成できるクエリ例へのリンクを示します。

データマイニングクエリについて

クエリツールとインターフェイス

さまざまな種類のモデルのクエリ

要件

データマイニングクエリについて

Analysis Services データマイニングでは、次の種類のクエリがサポートされています。

予測クエリ (データマイニング)

モデル内のパターンおよび入力データから推論するクエリ。
コンテンツクエリ (データマイニング)

メタデータ、統計、およびその他、モデル自体の情報を返すクエリ。
ドリルスルークエリ (データマイニング)

基になるケースデータをモデルから取得できるクエリ。モデルで使用されていないデータさえ構造体から取得できます。
データ定義クエリ (データマイニング)

モデルからの情報は返さないが、モデルおよび構造体のビルド、またはモデルまたは構造体内のデータの更新に使用されるクエリ。

クエリを作成する前に、SQL Server の各データマイニングアルゴリズムを使用して作成されるモデルの違いを理解してください。

各種のアルゴリズムに対して用意されているカスタムデータマイニングビューアーを使用して、各種のモデルを参照して調査します。詳細については、「マイニングモデルビューアーのタスクと操作方法」を参照してください。
Microsoft 汎用コンテンツツリービューアーを使用して、各種のモデルのモデルコンテンツを確認します。この情報を解釈するには、「マイニングモデルコンテンツ (Analysis Services - データマイニング)」を参照してください。

クエリツールとインターフェイス

SQL Server で用意されているクエリツールを使用すると、データマイニングクエリを対話形式で作成できます。グラフィカルな予測クエリビルダーは、SQL Server データツール (SSDT) と SQL Server Management Studio の両方で用意されています。これまで予測クエリビルダーを使用したことがない場合は、インターフェイスに慣れるために「基本的なデータマイニングチュートリアル」の手順を実行することをお勧めします。手順の概要を簡単に把握するには、予測クエリビルダーを使用した予測クエリの作成を使用した「クエリの作成」を参照してください。

予測クエリビルダーは、クエリを開始して後からカスタマイズする際に役立ちます。簡単にデータソースを追加して列にマップすることができ、その後、DMX ビューに切り替えて、WHERE 句や他の関数を追加してクエリをカスタマイズできます。

データマイニングモデル、およびクエリのビルド方法を理解したら、データマイニング拡張機能 (DMX) を使用してクエリを直接作成することもできます。 DMX は Transact-SQL に似たクエリ言語であり、多数のクライアントから使用できます。 DMX は、カスタムの予測と複雑なクエリの両方を作成するために選ばれるツールです。 DMX の概要については、「DMX を使用したデータマイニングモデルの作成とクエリ : チュートリアル (Analysis Services - データマイニング)」を参照してください。

DMX エディターは、SQL Server データツール (SSDT) と SQL Server Management Studio の両方で提供されます。また、予測クエリビルダーを使用してクエリを開始してから、ビューをテキストエディターに変更し、DMX ステートメントを別のクライアントにコピーすることもできます。詳細については、「データマイニングクエリインターフェイス」を参照してください。

DMX ステートメントをプログラムで作成し、AMO または XMLA を使用して、クライアントから Analysis Services サーバーに送信できます。ただし、DMX は、マイニングモデルに対するクエリを作成するために使用する必要がある言語です。

さらに、データマイニングスキーマ行セットに基づく動的管理ビュー (DMV) を使用して、メタデータ、統計、またはモデルコンテンツに対してクエリを実行することもできます。 DMV により、SELECT ステートメントを使用してモデルに関する情報を簡単に取得できるようになりますが、予測を作成することはできません。 Analysis Services でサポートされる DMV の詳細については「動的管理ビュー (DMV) を使用した Analysis Services の監視」を参照してください。

また、データマイニングクエリタスクまたはデータマイニングクエリ変換を使用することで、Integration Services パッケージで使用するデータマイニングクエリも作成できます。制御フロータスクでは複数の種類の DMX クエリがサポートされますが、データフロー変換ではそのデータフローのデータに対するクエリ (つまり、PREDICTION JOIN 構文を使用するクエリ) のみがサポートされます。

さまざまな種類のモデルのクエリ

データマイニングクエリで取得できる情報の種類は、モデルの作成時に使用されたアルゴリズムから大きな影響を受けます。違いの理由は、各アルゴリズムがデータをさまざまな方法で処理し、さまざまなパターンを格納するためです。たとえば、クラスターを作成するアルゴリズムもあれば、クラスターを作成するアルゴリズムもあります。したがって、場合によっては、使用するモデルの種類に応じて特定の予測関数やクエリ関数を使用する必要があります。

次に、クエリで使用できる関数を要約して示します。

汎用の予測関数: Predict 関数は多様性があり、すべての種類のモデルで使用できます。この関数は、使用しているモデルの種類を自動的に検出し、パラメーターの追加を要求します。詳細については、「Predict (DMX)」を参照してください。

注意
すべてのモデルが予測に使用されるわけではありません。たとえば、予測可能な属性を持たないクラスタリングのモデルを作成できます。ただし、モデルに予測可能属性がない場合でも、モデルから他の役立つ情報を返す予測クエリを作成することはできます。

カスタム予測関数: 各種のモデルには、そのアルゴリズムで作成されたパターンを処理するための一連の予測関数が用意されています。

たとえば、Lag 関数はタイムシリーズモデルのために用意されており、このモデルで使用される履歴データを表示できます。クラスタリングモデルの場合は、ClusterDistance などの関数がさらに重要です。

各種のモデルでサポートされる関数の詳細については、次のリンクを参照してください。

結合モデルのクエリ例	Microsoft Naive Bayes アルゴリズム
クラスタリングモデルのクエリ例	ニューラルネットワークモデルのクエリ例
デシジョンツリーモデルのクエリ例	シーケンスクラスターモデルのクエリの例
線形回帰モデルのクエリ例	タイムシリーズモデルのクエリ例
ロジスティック回帰モデルのクエリ例

また、VBA 関数を呼び出したり、独自の関数を作成したりすることもできます。詳細については、「関数 (DMX)」を参照してください。

汎用の統計: ほとんどすべてのモデルで使用できる関数が多数あります。これらの関数では、標準偏差など説明的な統計情報の標準的なセットが返されます。

たとえば、PredictHistogram 関数は、指定した列のすべての状態を含むテーブルを返します。

詳細については、「一般的な予測関数 (DMX)」を参照してください。
カスタム統計: 他に、モデルの種類ごとに補助的な関数が用意されています。このような関数では、特定の分析タスクに関連する統計情報が生成されます。

たとえば、クラスタリングモデルを使用する場合は、特定のケースとクラスターに関連する可能性スコアを返す、関数 PredictCaseLikelihood を使用できます。ただし、線形回帰モデルを作成した場合は、係数と切片を取得することが必要になります。これは、コンテンツクエリを使用すると実行できます。
モデルコンテンツ関数: すべてのモデルのコンテンツは標準化された形式で表され、単純なクエリを使用して取得できます。 DMX を使用して、モデルコンテンツに対するクエリを作成します。一部のモデルコンテンツは、データマイニングスキーマ行セットを使用して取得することもできます。

モデルコンテンツでは、返されるテーブルの各行またはノードの意味は、モデルのビルドに使用されたアルゴリズムの種類と列のデータ型によって異なります。詳細については、「コンテンツクエリ (データマイニング)」を参照してください。

要件

モデルに対するクエリを作成する前に、データマイニングモデルを処理する必要があります。 Analysis Services オブジェクトの処理には特別な権限が必要です。マイニングモデルの処理の詳細については、「処理の要件および注意事項 (データマイニング)」を参照してください。

データマイニングモデルに対するクエリを実行するには、実行するクエリの種類により、異なるレベルの権限が必要になります。たとえば、通常、ケースや構造データのドリルスルーでは、マイニング構造オブジェクトまたはマイニングモデルオブジェクトに対して設定された別の権限が必要になります。

ただし、クエリが外部データを使用し、OPENROWSET や OPENQUERY などのステートメントが含まれる場合には、クエリ対象のデータベースではそれらのステートメントを有効にする必要があります。また、基になるデータベースオブジェクトに対する権限も必要です。

データマイニングクエリを実行するために必要なセキュリティコンテキストの詳細については、「セキュリティの概要 (データマイニング)」を参照してください。

このセクションの内容

ここでは、各種のデータマイニングクエリについて詳しく説明し、データマイニングモデルに対してクエリを作成する詳しい例へのリンクを示します。

タスク	リンク
データマイニングクエリのチュートリアルの表示	レッスン 6: 予測の作成と操作 (基本的なデータマイニングチュートリアル) 時系列予測の DMX のチュートリアル
SQL Server Management studio と SQL Server データツール (SSDT) のデータマイニングクエリツールの使用	SQL Server Management Studio での DMX クエリの作成予測クエリビルダーを使用した予測クエリの作成モデルへの予測関数の適用手動での予測クエリの編集
予測クエリで使用される外部データの操作	予測クエリの入力データの選択およびマップ予測クエリの入力データの選択およびマップ
クエリ結果の操作	予測クエリの結果の表示および保存
Management Studio の DMX クエリテンプレートと XMLA クエリテンプレートの使用	テンプレートからの単一予測クエリの作成 XML/A を使用したデータマイニングクエリの作成 SQL Server Management Studio での Analysis Services テンプレートの使用
コンテンツクエリの詳細の説明と例の参照	マイニングモデルのコンテンツクエリの作成マイニングモデルの作成に使用されたパラメーターのクエリコンテンツクエリ (データマイニング)
クエリオプションの設定およびクエリの権限と問題のトラブルシューティング	データマイニングクエリのタイムアウト値の変更
Integration Services のデータマイニングコンポーネントの使用	データマイニングクエリタスクデータマイニングクエリ変換

次の方法で共有

データマイニングクエリ

データマイニングクエリについて

クエリツールとインターフェイス

さまざまな種類のモデルのクエリ

要件

このセクションの内容

関連タスク

関連項目

概念

その他のリソース

次の方法で共有

データ マイニング クエリ

データ マイニング クエリについて

クエリ ツールとインターフェイス

さまざまな種類のモデルのクエリ

要件

このセクションの内容

関連タスク

関連項目

概念

その他のリソース

データマイニングクエリ

データマイニングクエリについて

クエリツールとインターフェイス