估计向导(Excel 数据挖掘外接程序)
“估算”向导可帮助你创建估算模型。 估计模型从数据中提取模式,并使用这些模式预测将影响结果的因素。
估计用于预测数字结果。 例如,如果目标列包含学校的升学率(升学率以百分比表示),则可分析有可能提高或降低升学率的因素,如每个学校的学生数量、学生与教师的比例以及教师数量。
使用估计数据向导
在 “数据挖掘” 功能区上,单击“ 估计”。
在“ 选择源数据 ”对话框中,选择要使用的源数据。 可以使用 Excel 表、Excel 数据范围或 外部数据源中的数据。
如果使用外部数据源,则可以创建自定义视图或查询并将其保存为 Analysis Services 数据源。
在“ 估计 ”对话框中,选择要 分析的列。
目标列必须包含连续的数值数据。
选中“输入列”复选框,选择要用作 输入的列 。
这些列将用于创建模式。 您应当从分析中删除那些不可能有用的列(如 ID 号)或包含无关数据的列。
“估算”向导为数据集选择最佳算法。 但是,可以单击“ 参数 ”打开“ 算法参数 ”对话框并设置高级选项。
如果数据是数值,并且可以使用 Microsoft 线性回归方法,则可以检查已知 (或强烈怀疑) 与可预测值关联的任何数值列的回归器框。
然后,此算法将对该列中的值进行测试以确定它们是否会影响结果。 如果不确定,请单击“ 建议 ”,该算法将测试所有列,并自动检测用作回归器的最佳值。
注意
回归量是创建估计所必需的。 向导总是基于最初传递的数据来推荐最佳回归量。 因此,如果您不能确定,最好接受向导所推荐的选择。
在“ 将数据拆分为训练集和测试集 ”页上,指定是否要创建用于测试的一小部分数据。
在“ 完成 ”页上,提供新挖掘结构和挖掘模式的名称,或接受提供的默认名称。
设置模型使用选项。
选择“ 浏览 ”,立即在查看器中打开模型。
此图形查看器会显示一个依赖关系网络图形以及由该算法生成的决策树。 通过研究这些信息,您可以更好地理解影响估计值的因素。
选择“ 启用钻取 ”,让分析用户查看基础数据。
此选项仅在您使用决策树或线性回归算法时可用。
使用临时模型。 如果您选择此选项,模型将不会被保存到服务器。 在您关闭 Excel 时,临时模型将被删除。
有关估计模型的详细信息
“估算”向导支持使用以下任何算法:
Microsoft 决策树算法
Microsoft 线性回归算法
Microsoft 逻辑回归算法
Microsoft 神经网络算法
在“ 算法参数 ”对话框中,可以根据所选算法设置其他高级选项。 有关每种算法的选项的信息,请参阅 SQL Server 联机丛书中的下列主题:
要求
若要使用估算数据向导,必须连接到 Analysis Services 数据库。
有关如何创建连接的信息,请参阅 连接到源数据 (数据挖掘客户端 for Excel) 。
若要使用估计算法,尝试预测的结果必须表示为数值,如货币、销售额、日期或时间。