コール センター データ用のデータ ソース ビューの追加 (中級者向けデータ マイニング チュートリアル)
ここでは、コール センター データへのアクセスに使用するデータ ソース ビューを追加します。 最初に調査用のニューラル ネットワーク モデルを構築し、その後、提案作成用のロジスティック回帰モデルを構築します。どちらのモデルにも、同じデータを使用します。
さらに、データ ソース ビュー デザイナーを使用して曜日の列を追加します。 これは、ソース データによってコール センター データを日付別に追跡していますが、問い合わせ件数とサービス品質にはどちらも、週末か平日かによって定期的なパターンがあることが経験上わかっているためです。
手順
データ ソース ビューを追加するには
ソリューション エクスプローラーで [データ ソース ビュー] を右クリックし、[新しいデータ ソース ビュー] をクリックします。
データ ソース ビュー ウィザードが開きます。
[データ ソース ビュー ウィザードへようこそ] ページで [次へ] をクリックします。
[データ ソースの選択] ページの [リレーショナル データ ソース] で、 Adventure Works DW Multidimensional 2012 データ ソースを選択します。 このデータ ソースがない場合は、「基本的なデータ マイニング チュートリアル」を参照してください。 [次へ] をクリックします。
[テーブルとビューの選択] ページで次のテーブルを選択し、右矢印をクリックしてデータ ソース ビューに追加します。
FactCallCenter (dbo)
DimDate
[次へ] をクリックします。
既定では、 Adventure Works DW Multidimensional 2012 という名前のデータ ソース ビューが [ウィザードの完了] ページに表示されます。 この名前を CallCenter に変更し、[完了] をクリックします。
データ ソース ビュー デザイナーが開き、CallCenter データ ソース ビューが表示されます。
[データ ソース ビュー] ペイン内で右クリックし、[テーブルの追加と削除] をクリックします。 DimDate テーブルを選択し、[OK] をクリックします。
各テーブルの DateKey 列間のリレーションシップが自動的に追加されます。 このリレーションシップは、EnglishDayNameOfWeek 列を DimDate テーブルから取得してモデルで使用するときに使用します。
データ ソース ビュー デザイナーで、FactCallCenter テーブルを右クリックし、[新しい名前付き計算] をクリックします。
[名前付き計算の作成] ダイアログ ボックスで、次の値を入力します。
列名
DayOfWeek
説明
DimDate テーブルから曜日を取得。
式
(SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)
必要なデータがこの式で作成されることを確認するには、FactCallCenter テーブルを右クリックし、[データの探索] をクリックします。
データ マイニングでの使用方法を理解するために、使用可能なデータを少し時間をかけて確認します。
列名 |
内容 |
---|---|
FactCallCenterID |
データ ウェアハウスにデータがインポートされたときに作成される任意のキー。 この列は一意のレコードを識別する列で、データ マイニング モデルのケース キーとして使用されます。 |
DateKey |
コール センター業務の日付 (整数値)。 データ ウェアハウスでは日付のキーに整数がよく使用されますが、日付の値でグループ化する場合は、日付/時刻の形式で日付を取得することもできます。 ベンダーからは日々、シフトごとに別個のレポートが提供されるため、日付は一意ではありません。 |
WageType |
平日、週末、祝日のいずれに該当するかを示します。 カスタマー サービスの質に週末と平日で差がある可能性があるため、 この列を入力として使用します。 |
Shift |
問い合わせが記録されるシフトを示します。 このコール センターでは、1 日の労働時間が、AM、PM1、PM2、Midnight の 4 つのシフトに分かれています。 カスタマー サービスの質がシフトによって異なる可能性があるため、この列を入力として使用します。 |
LevelOneOperators |
勤務しているレベル 1 オペレーターの人数を示します。 コール センターの従業員のレベルはレベル 1 から始まるため、このレベルの従業員は経験が浅い従業員です。 |
LevelTwoOperators |
勤務しているレベル 2 オペレーターの人数を示します。 従業員は一定の実働時間を満たして初めて、レベル 2 のオペレーターになることができます。 |
TotalOperators |
シフト中に勤務しているオペレーターの人数の合計。 |
Calls |
シフト中に受けた問い合わせの件数。 |
AutomaticResponses |
完全に自動呼処理 (対話型音声応答、IVR) によって処理された問い合わせの件数。 |
Orders |
問い合わせの結果として発生した注文の件数。 |
IssuesRaised |
問い合わせによって発生した、フォローアップが必要な案件の件数。 |
AverageTimePerIssue |
問い合わせの電話への応対に要した平均時間。 |
ServiceGrade |
サービスの全体的な質を示す 1 つの指標である、シフトごとの電話放棄呼率。 電話放棄呼率が高いほど、顧客の満足度が低下し、注文の機会を失う可能性が高くなります。 |
このデータには、1 つの日付列に基づく列が 4 つ含まれていることに注意してください。WageType、DayOfWeek、Shift、および DateKey の 4 つです。 通常、データ マイニングでは、同じデータから派生する列を複数使用することはお勧めしません。それらの値の間の関連が強すぎて、他のパターンがわかりにくくなることがあるからです。
ただし、このモデルでは、一意の値が多すぎるため、DateKey を使用していません。 また、Shift と DayOfWeek には直接的なリレーションシップがなく、WageType と DayOfWeek のリレーションシップも一部だけです。 共線性について気にかかる場合は、使用可能なすべての列を使用して構造を作成し、モデルごとに無視する列を変えて影響をテストしてみてください。
このレッスンの次の作業
ニューラル ネットワーク構造およびモデルの作成 (中級者向けデータ マイニング チュートリアル)