使用更新数据进行时序预测(数据挖掘中级教程)
使用扩展的销售额数据创建预测
在本课中,您将创建一个预测查询,该查询将新的销售额数据添加到模型。 通过使用新数据扩展模型,您可以获得最新预测,其中包括最新的数据点。
创建使用新数据的时序预测非常简单:只需将参数EXTEND_MODEL_CASES添加到 PredictTimeSeries (DMX) 函数,指定新数据的源,并指定要获取的预测数。
警告
参数 EXTEND_MODEL_CASES 是可选的;默认情况下,通过联接新数据作为输入将该模型扩展您创建时序预测查询的任意时间。
生成预测查询和添加新数据
如果模型尚未打开,请双击“预测”结构,然后在“数据挖掘Designer,单击”挖掘模型预测“选项卡。
在“ 挖掘模型 ”窗格中,应已选择模型“预测”。 如果未选中,请单击“ 选择模型”,然后选择模型“预测”。
在 “选择输入表 () 窗格中,单击” 选择事例表”。
在 “选择表 ”对话框中,选择数据源 Adventure Works DW Multidimensional 2012。
从数据源视图列表中,选择“新建”“销售”“数据”,然后单击“ 确定”。
右键单击设计区域的图面,然后选择“ 修改连接”。
使用 “ 修改映射 ” 对话框,将模型中的列映射到外部数据中的列,如下所示:
将挖掘模型中的 ReportingDate 列映射到输入数据中的 NewDate 列。
将挖掘模型中的 Amount 列映射到输入数据中的 NewAmount 列。
将挖掘模型中的 Quantity 列映射到输入数据中的 NewQty 列。
将挖掘模型中的 ModelRegion 列映射到输入数据中的 Series 列。
现在,您将生成预测查询。
首先,将一个列添加到预测查询来输出预测应用到的序列。
在网格中,单击“ 源”下的第一个空行,然后选择“预测”。
在 “字段 ”列中,选择“模型区域”,并为 “别名”键入
Model Region
。
接下来,添加和编辑预测函数。
单击空行,然后在“ 源”下选择“ 预测函数”。
对于 “字段”,选择“ PredictTimeSeries”。
对于 “别名”,请键入 “预测值”。
将字段“数量”从“ 挖掘模型 ”窗格拖到“ 条件/参数 ”列中。
在 “条件/参数 ”列中的字段名称后,键入以下文本: 5,EXTEND_MODEL_CASES
“ 条件/参数 ”文本框的完整文本应如下所示:
[Forecasting].[Quantity],5,EXTEND_MODEL_CASES
单击“ 结果 ”并查看结果。
预测从 7 月(原始数据结束后的第一个时间段)开始,到 11 月结束(原始数据结束后的第 5 个时间段)。
您可以看到,要高效使用此预测查询类型,您需要知道旧数据何时结束以及新数据中有多少时间段。
例如,在此模型中,原始数据序列 6 月结束,并且数据针对 7 月、 8 月和 9 月。
使用 EXTEND_MODEL_CASES 的预测始终在原始数据序列结束时开始。 因此,如果您只想获取未知月份的预测,则需要指定预测的起点和终点。 这两个值被指定为从旧数据结束时开始的一些时间段。
下面的过程演示如何做到这点。
更改预测的起点和终点
在“预测查询生成器”中,单击“ 查询 ”切换到 DMX 视图。
找到包含 PredictTimeSeries 函数的 DMX 语句并按以下方式更改它:
PredictTimeSeries([Forecasting 12].[Quantity],4,6,EXTEND_MODEL_CASES)
单击“ 结果 ”并查看结果。
现在预测从 10 月开始(原始数据结束后的第四个时间段),到 12 月结束(原始数据结束后的第六个时间段)。
课程中的下一个任务
另请参阅
Microsoft Time Series Algorithm Technical Reference
时序模型的挖掘模型内容(Analysis Services - 数据挖掘)