コール センター データ用のデータ ソース ビューの追加 (中級者向けデータ マイニング チュートリアル)
対象: SQL Server 2016 Preview
ここでは、コール センター データへのアクセスに使用するデータ ソース ビューを追加します。 最初に調査用のニューラル ネットワーク モデルを構築し、その後、提案作成用のロジスティック回帰モデルを構築します。どちらのモデルにも、同じデータを使用します。
さらに、データ ソース ビュー デザイナーを使用して曜日の列を追加します。 これは、ソース データによってコール センター データを日付別に追跡していますが、問い合わせ件数とサービス品質にはどちらも、週末か平日かによって定期的なパターンがあることが経験上わかっているためです。
手順
データ ソース ビューを追加するには
ソリューション エクスプ ローラー, を右クリックして データ ソース ビュー, を選択して 新しいデータ ソース ビューします。
データ ソース ビュー ウィザードが開きます。
[データ ソース ビュー ウィザードへようこそ] ページで **[次へ]**をクリックします。
データ ソースの選択 ] ページで、[ リレーショナル データ ソース, を選択、 Adventure Works DW Multidimensional 2012 データ ソース。 このデータ ソースがないを参照してください。 [基本的なデータ マイニング チュートリアル](../Topic/Basic%20Data%20Mining%20Tutorial.md)します。 **[次へ]**をクリックします。
[テーブルおよびビュー ] ページで、次の表を選択して、データ ソース ビューに追加する右矢印をクリックします。
FactCallCenter (dbo)
DimDate
**[次へ]**をクリックします。
ウィザードの完了 ページで、既定では、データ ソース ビューの名前は Adventure Works DW Multidimensional 2012です。 名前を変更 CallCenter, 、をクリックし、 完了します。
表示するデータ ソース ビュー デザイナーが開き、 CallCenter データ ソース ビューです。
データ ソース ビュー ウィンドウ内を右クリックし、選択 テーブルの追加/削除します。 テーブルを選択 DimDate ] をクリック OKします。
間で、リレーションシップを自動的に追加する必要があります、 DateKey 各テーブル内の列です。 このリレーションシップを使用して、列を取得する、 EnglishDayNameOfWeek, から、 DimDate テーブルが表示され、モデルで使用します。
データ ソース ビュー デザイナーで、テーブルを右クリックし FactCallCenter, を選択して 新しい名前付き計算します。
名前付き計算の作成 ] ダイアログ ボックスで、次の値を入力します。
列名 DayOfWeek Description DimDate テーブルから曜日を取得。 式 (SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)
式は、データを作成することを確認する必要がある、テーブルを右クリックして FactCallCenter, 、し、[ データの探索します。
データ マイニングでの使用方法を理解するために、使用可能なデータを少し時間をかけて確認します。
列名 | [値を含む] |
---|---|
FactCallCenterID | データ ウェアハウスにデータがインポートされたときに作成される任意のキー。 この列は一意のレコードを識別する列で、データ マイニング モデルのケース キーとして使用されます。 |
DateKey | コール センター業務の日付 (整数値)。 データ ウェアハウスでは日付のキーに整数がよく使用されますが、日付の値でグループ化する場合は、日付/時刻の形式で日付を取得することもできます。 ベンダーからは日々、シフトごとに別個のレポートが提供されるため、日付は一意ではありません。 |
WageType | 1 日が、平日、週末、または休日をしたかどうかを示します。 カスタマー サービスの質に違い平日と週末のため、この列は入力として使用可能であればします。 |
Shift キー | 問い合わせが記録されるシフトを示します。 このコール センターでは、1 日の労働時間が、AM、PM1、PM2、Midnight の 4 つのシフトに分かれています。 カスタマー サービスの質がシフトによって異なる可能性があるため、この列を入力として使用します。 |
LevelOneOperators | 勤務時間外の第 1 レベルの演算子の数を示します。 コール センターの従業員のレベルはレベル 1 から始まるため、このレベルの従業員は経験が浅い従業員です。 |
LevelTwoOperators | 勤務しているレベル 2 オペレーターの人数を示します。 従業員は、レベル 2 のオペレーターとして限定するサービスの時間数をログする必要があります。 |
TotalOperators | シフト中に勤務しているオペレーターの人数の合計。 |
Calls | シフト中に受けた問い合わせの件数。 |
AutomaticResponses | 完全に自動呼処理 (対話型音声応答、IVR) によって処理された問い合わせの件数。 |
Orders | 問い合わせの結果として発生した注文の件数。 |
IssuesRaised | 問い合わせによって発生した、フォローアップが必要な案件の件数。 |
AverageTimePerIssue | 問い合わせの電話への応対に要した平均時間。 |
ServiceGrade | として、サービスの全体的な質を示すメトリックを測定、 破棄率 シフトごとです。 電話放棄呼率が高いほど、顧客の満足度が低下し、注文の機会を失う可能性が高くなります。 |
データが 1 つの日付列に基づく 4 つの異なる列が含まれることに注意してください: WageType, 、DayOfWeek, 、Shift, 、および DateKeyします。 通常、データ マイニングでは、同じデータから派生する列を複数使用することはお勧めしません。それらの値の間の関連が強すぎて、他のパターンがわかりにくくなることがあるからです。
ただし、私たちは使用しません DateKey モデルの一意の値が多すぎますが含まれています。 直接的な関係はありません shift キーを押し と DayOfWeek, 、および WageType と DayOfWeek は部分的にのみ関連します。 共線性について気にかかる場合は、使用可能なすべての列を使用して構造を作成し、モデルごとに無視する列を変えて影響をテストしてみてください。
このレッスンの次の作業
ニューラル ネットワーク構造およびモデル ( 中級者向けデータ マイニング チュートリアル ) を作成します。