コール センター データ用のデータ ソース ビューの追加 (中級者向けデータ マイニング チュートリアル)

 

対象: SQL Server 2016 Preview

ここでは、コール センター データへのアクセスに使用するデータ ソース ビューを追加します。 最初に調査用のニューラル ネットワーク モデルを構築し、その後、提案作成用のロジスティック回帰モデルを構築します。どちらのモデルにも、同じデータを使用します。

さらに、データ ソース ビュー デザイナーを使用して曜日の列を追加します。 これは、ソース データによってコール センター データを日付別に追跡していますが、問い合わせ件数とサービス品質にはどちらも、週末か平日かによって定期的なパターンがあることが経験上わかっているためです。

手順

データ ソース ビューを追加するには

  1. ソリューション エクスプ ローラー, を右クリックして データ ソース ビュー, を選択して 新しいデータ ソース ビューします。

    データ ソース ビュー ウィザードが開きます。

  2. [データ ソース ビュー ウィザードへようこそ] ページで **[次へ]**をクリックします。

  3. データ ソースの選択 ] ページで、[ リレーショナル データ ソース, を選択、 Adventure Works DW Multidimensional 2012 データ ソース。 このデータ ソースがないを参照してください。 [基本的なデータ マイニング チュートリアル](../Topic/Basic%20Data%20Mining%20Tutorial.md)します。 **[次へ]**をクリックします。

  4. [テーブルおよびビュー ] ページで、次の表を選択して、データ ソース ビューに追加する右矢印をクリックします。

    • FactCallCenter (dbo)

    • DimDate

  5. **[次へ]**をクリックします。

  6. ウィザードの完了 ページで、既定では、データ ソース ビューの名前は Adventure Works DW Multidimensional 2012です。 名前を変更 CallCenter, 、をクリックし、 完了します。

    表示するデータ ソース ビュー デザイナーが開き、 CallCenter データ ソース ビューです。

  7. データ ソース ビュー ウィンドウ内を右クリックし、選択 テーブルの追加/削除します。 テーブルを選択 DimDate ] をクリック OKします。

    間で、リレーションシップを自動的に追加する必要があります、 DateKey 各テーブル内の列です。 このリレーションシップを使用して、列を取得する、 EnglishDayNameOfWeek, から、 DimDate テーブルが表示され、モデルで使用します。

  8. データ ソース ビュー デザイナーで、テーブルを右クリックし FactCallCenter, を選択して 新しい名前付き計算します。

    名前付き計算の作成 ] ダイアログ ボックスで、次の値を入力します。

    列名 DayOfWeek
    Description DimDate テーブルから曜日を取得。
    (SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)

    式は、データを作成することを確認する必要がある、テーブルを右クリックして FactCallCenter, 、し、[ データの探索します。

  9. データ マイニングでの使用方法を理解するために、使用可能なデータを少し時間をかけて確認します。

列名 [値を含む]
FactCallCenterID データ ウェアハウスにデータがインポートされたときに作成される任意のキー。

この列は一意のレコードを識別する列で、データ マイニング モデルのケース キーとして使用されます。
DateKey コール センター業務の日付 (整数値)。 データ ウェアハウスでは日付のキーに整数がよく使用されますが、日付の値でグループ化する場合は、日付/時刻の形式で日付を取得することもできます。

ベンダーからは日々、シフトごとに別個のレポートが提供されるため、日付は一意ではありません。
WageType 1 日が、平日、週末、または休日をしたかどうかを示します。

カスタマー サービスの質に違い平日と週末のため、この列は入力として使用可能であればします。
Shift キー 問い合わせが記録されるシフトを示します。 このコール センターでは、1 日の労働時間が、AM、PM1、PM2、Midnight の 4 つのシフトに分かれています。

カスタマー サービスの質がシフトによって異なる可能性があるため、この列を入力として使用します。
LevelOneOperators 勤務時間外の第 1 レベルの演算子の数を示します。

コール センターの従業員のレベルはレベル 1 から始まるため、このレベルの従業員は経験が浅い従業員です。
LevelTwoOperators 勤務しているレベル 2 オペレーターの人数を示します。

従業員は、レベル 2 のオペレーターとして限定するサービスの時間数をログする必要があります。
TotalOperators シフト中に勤務しているオペレーターの人数の合計。
Calls シフト中に受けた問い合わせの件数。
AutomaticResponses 完全に自動呼処理 (対話型音声応答、IVR) によって処理された問い合わせの件数。
Orders 問い合わせの結果として発生した注文の件数。
IssuesRaised 問い合わせによって発生した、フォローアップが必要な案件の件数。
AverageTimePerIssue 問い合わせの電話への応対に要した平均時間。
ServiceGrade として、サービスの全体的な質を示すメトリックを測定、 破棄率 シフトごとです。 電話放棄呼率が高いほど、顧客の満足度が低下し、注文の機会を失う可能性が高くなります。

データが 1 つの日付列に基づく 4 つの異なる列が含まれることに注意してください: WageType, 、DayOfWeek, 、Shift, 、および DateKeyします。 通常、データ マイニングでは、同じデータから派生する列を複数使用することはお勧めしません。それらの値の間の関連が強すぎて、他のパターンがわかりにくくなることがあるからです。

ただし、私たちは使用しません DateKey モデルの一意の値が多すぎますが含まれています。 直接的な関係はありません shift キーを押しDayOfWeek, 、および WageTypeDayOfWeek は部分的にのみ関連します。 共線性について気にかかる場合は、使用可能なすべての列を使用して構造を作成し、モデルごとに無視する列を変えて影響をテストしてみてください。

このレッスンの次の作業

ニューラル ネットワーク構造およびモデル ( 中級者向けデータ マイニング チュートリアル ) を作成します。

参照

多次元モデルのデータ ソース ビュー