処理の要件および注意事項 (データマイニング)

[アーティクル]
07/30/2013

このトピックでは、データマイニングオブジェクトを処理するときに注意するいくつかの技術的な考慮事項について説明します。処理について、および処理がデータマイニングに適用される方法に関する一般情報については、「データマイニングオブジェクトの処理」を参照してください。

リレーショナルストアに対するクエリ

マイニング構造の処理

マイニングモデルの処理

処理中のリレーショナルストアに対するクエリ

データマイニングでの処理には、ソースデータのクエリ、生の統計情報の特定、およびモデル定義とアルゴリズムを使用したマイニングモデルのトレーニングの 3 つの段階があります。

Analysis Services サーバーは、生データを提供するデータベースに対してクエリを実行します。そのデータベースは、SQL Server 2012 以前のバージョンの SQL Server データベースエンジンのインスタンスである場合もあります。データマイニング構造の処理時には、ソース内のデータがマイニング構造に転送され、圧縮形式でディスク上に新たに保存されます。データソース内のすべての列が処理されるとは限りません。バインドの定義に従って、マイニング構造に含まれる列だけが処理されます。

Analysis Services はそのデータを使用して、すべてのデータおよび離散化列のインデックスと、連続列のための別のインデックスを作成します。入れ子になったテーブルごとに、インデックスを作成するためのクエリが実行され、入れ子になったテーブルとケーステーブルの各ペアの関係を処理するための追加のクエリが生成されます。このように複数のクエリが作成されるのは、特殊な内部多次元データストアを処理するためです。 Analysis Services によってリレーショナルストアに送信されるクエリの数を制限するには、サーバープロパティの DatabaseConnectionPoolMax を設定します。詳細については、「OLAP のプロパティ」を参照してください。

モデルの処理時に、モデルは、データソースからデータを再度読み取るのではなく、マイニング構造からデータの概要を取得します。サーバーは、作成されたキューブと、キャッシュされたインデックスデータとケースデータを使用して、モデルのトレーニングを行うための独立したスレッドを作成します。

並列モデル処理をサポートする SQL Server のエディションについては、「SQL Server 2012 の各エディションがサポートする機能」(https://go.microsoft.com/fwlink/?linkid=232473) を参照してください。

マイニング構造の処理

マイニング構造は、すべての依存モデルと一緒に処理することも、個別に処理することもできます。処理に時間がかかると予想されるモデルがあり、その操作を保留する場合、モデルとは別にマイニング構造を処理すると便利です。

詳細については、「マイニング構造の処理」を参照してください。

Analysis Services ではマイニング構造キャッシュがローカルに保持されるので、ハードディスク領域を節約する場合は注意してください。つまり、すべてのトレーニングデータがローカルハードディスクに書き込まれます。データをキャッシュしない場合は、マイニング構造の MiningStructureCacheMode プロパティを ClearAfterProcessing に設定することで、既定値を変更できます。これにより、モデルを処理した後にキャッシュが破棄されます。また、マイニング構造のドリルスルーも無効になります。詳細については、「ドリルスルークエリ (データマイニング)」を参照してください。

また、キャッシュを消去すると、提示されたテストセット (定義している場合) を使用できなくなり、テストセットパーティションの定義も失われます。提示されたテストセットの詳細については、「トレーニングデータセットとテストデータセット」を参照してください。

マイニングモデルの処理

関連付けられているマイニング構造とは別にマイニングモデルを処理することも、マイニング構造に基づくすべてのモデルをマイニング構造と共に処理することもできます。

詳細については、「マイニングモデルの処理」を参照してください。

ただし、SQL Server データツール (SSDT) および SQL Server Management Studio では、マイニング構造と共に処理するマイニングモデルを複数選択することができません。処理するモデルを制御する必要がある場合は、モデルを個別に選択するか、XMLA または DMX を使用してモデルを順番に処理する必要があります。

再処理が必要な場合

モデルの操作を開始する前に、定義する Analysis Services モデルを処理する必要があります。また、マイニングモデル構造の変更、トレーニングデータの更新、既存のマイニングモデルの変更、または構造への新しいマイニングモデルの追加を行った場合は、必ずマイニングモデルを再処理する必要があります。

マイニングモデルは、以下のシナリオでも処理されます。

プロジェクトの配置: 通常は、プロジェクトの設定と現在の状態に応じて、プロジェクトの配置時にそのプロジェクトのマイニングモデルが完全処理されます。

配置を開始すると、以前に処理されたバージョンが Analysis Services サーバーに存在して構造的に変更されていない場合を除き、処理が自動的に開始されます。プロジェクトを配置するには、ドロップダウンリストから [ソリューションの配置] を選択するか、または F5 キーを押します。次の操作を実行できます。

マイニングモデルの配置方法を制御する Analysis Services の配置プロパティの設定方法の詳細については、「データマイニングソリューションの配置」を参照してください。

マイニングモデルの移動: EXPORT コマンドを使用してマイニングモデルを移動する場合、モデルの定義だけがエクスポートされます。この定義には、モデルにデータを提供する予定のマイニング構造の名前が含まれます。

EXPORT コマンドと IMPORT コマンドを使用するシナリオとその再処理の要件を次に示します。

移動先のインスタンスにマイニング構造が存在し、そのマイニング構造が未処理の状態にある場合。

構造とモデルの両方を再処理する必要があります。
移動先のインスタンスにマイニング構造が存在し、そのマイニング構造が処理済みで、マイニングモデルのみがエクスポートされた場合。

モデルは処理せずに使用できます。
WITH DEENDENCIES キーワードを使用してマイニング構造の定義もエクスポートされた場合。

構造とモデルの両方を再処理する必要があります。

詳細については、「データマイニングオブジェクトのエクスポートおよびインポート」を参照してください。

次の方法で共有

処理の要件および注意事項 (データマイニング)

処理中のリレーショナルストアに対するクエリ

マイニング構造の処理

マイニングモデルの処理

再処理が必要な場合

関連項目

概念

その他のリソース

次の方法で共有

処理の要件および注意事項 (データ マイニング)

処理中のリレーショナル ストアに対するクエリ

マイニング構造の処理

マイニング モデルの処理

再処理が必要な場合

関連項目

概念

その他のリソース

処理の要件および注意事項 (データマイニング)

処理中のリレーショナルストアに対するクエリ

マイニングモデルの処理