为呼叫中心数据添加数据源视图(数据挖掘中级教程)
在本任务中,添加一个将用于访问呼叫中心数据的数据源视图。 将使用相同的数据来生成用于探索的初始神经网络模型以及用于提供建议的逻辑回归模型。
您还将使用数据源视图设计器向一周中某天添加列。 这是因为尽管源数据按日期跟踪呼叫中心数据,您的经验告诉您呼叫量和服务质量存在重复模式,取决于该天是周末还是工作日。
过程
添加数据源视图
在“解决方案资源管理器”中,右键单击“数据源视图”,然后选择“新建数据源视图”。
系统将打开数据源视图向导。
在“欢迎使用数据源视图向导” 页上,单击“下一步” 。
在 “选择数据源” 页上的“ 关系数据源”下,选择 Adventure Works DW Multidimensional 2012 数据源。 如果没有此数据源,请参阅 基本数据挖掘教程。 单击“下一步”。
在 “选择表和视图 ”页上,选择下表,然后单击向右箭头将其添加到数据源视图:
FactCallCenter (dbo)
DimDate
单击“下一步”。
在 “完成向导” 页上,数据源视图默认名为 Adventure Works DW Multidimensional 2012。 将名称更改为 CallCenter,然后单击“ 完成”。
数据源视图Designer打开以显示 CallCenter 数据源视图。
在“数据源视图”窗格中右键单击,然后选择 “添加/删除表”。 选择表 “DimDate ”,然后单击“ 确定”。
应在每个表中的
DateKey
列之间自动添加关系。 你将使用此关系从 DimDate 表获取列 EnglishDayNameOfWeek,并在模型中使用它。在数据源视图设计器中,右键单击表 FactCallCenter,然后选择“ 新建命名计算”。
在“ 创建命名计算 ”对话框中,键入以下值:
列名 DayOfWeek 说明 从 DimDate 表获取一周中的某天 表达式 (SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)
若要验证表达式是否创建了所需的数据,请右键单击表 FactCallCenter,然后选择“ 浏览数据”。
花点时间查看可用的数据,以便您可以了解在数据挖掘中如何使用它:
列名称 | 包含 |
---|---|
FactCallCenterID | 数据导入到数据仓库中时创建的一个任意键。 此列标识唯一的记录并应作为数据挖掘模型的事例键。 |
DateKey | 呼叫中心运营的日期,以整数表示。 整数日期键在数据仓库中经常用到,但是如果要按日期值分组,您可能要获取日期/时间格式的日期。 请注意由于供应商为每个运营日中的每个班次都提供了一个单独的报表,因此日期不是唯一的。 |
WageType | 指示日期是工作日、周末还是假日。 周末与工作日的客户服务质量可能存在差异,因此您将使用此列作为输入。 |
Shift | 指示为其记录呼叫的轮班时间。 此呼叫中心将工作日划分为四个轮班时间:AM、PM1、PM2 和 Midnight。 班次可能影响客户服务质量,因此您将使用此列作为输入。 |
LevelOneOperators | 指示值班的一级接线员的数量。 呼叫中心的员工最低级别为 l 级,因此这些员工经验不足。 |
LevelTwoOperators | 指示值班的二级接线员的数量。 员工必须记录一定数量的服务小时才能成为级别 2 操作员。 |
TotalOperators | 此轮班时间内存在的接线员的总数。 |
调用 | 此轮班时间内收到的呼叫数。 |
AutomaticResponses | 完全通过自动呼叫处理(交互式语音应答,即 IVR)来处理的呼叫数。 |
Orders | 由呼叫产生的订单数。 |
IssuesRaised | 由呼叫产生的需要后续操作的问题的数量。 |
AverageTimePerIssue | 应答一次来电所需的平均时间。 |
ServiceGrade | 一个指标,指示一般服务质量,以整个班次的 放弃率 衡量。 挂断率越高,说明客户的满意度越差,因此丢失潜在订单的可能性也就越大。 |
请注意,数据包括基于单个日期列的四个不同列: WageType
、 DayOfWeek、 Shift
和 DateKey
。 通常在数据挖掘中不要使用派生自同一数据的多个列,因为值之间的相关性太强,可能遮盖其他模式。
但是,我们不会在模型中使用 DateKey
,因为它包含太多唯一值。 与 DayOfWeek 之间Shift
没有直接关系,和 WageType
DayOfWeek 仅部分相关。 如果您担心共线性,可以使用所有可用列创建结构,然后在每个模型中忽略不同的列并测试效果。