简介

在机器学习中，算法用于训练模型，这些模型根据已知标签和在训练数据中发现的特征之间的相关性来预测新数据的未知标签。根据所使用的算法，可能需要指定超参数来配置模型的训练方式。例如，逻辑回归算法使用正则化率超参数来抵消过度拟合；深度学习神经网络模型使用学习率等超参数来控制在训练期间如何调整权重。

注意

机器学习是一种有自己的特定术语的学术领域。数据科学家将从训练特征中确定的值称为“参数”，那么就需要对用于配置训练行为、但不是从训练数据中派生的值使用不同的术语，所以就有了“超参数”一词。

为特定的算法选择的超参数值可能会对它训练的模型产生显著影响，因此，选择正确的超参数值可以区分与新数据一起使用时预测准确的模型和预测不准确的模型。

在 Azure Databricks 中，可以使用 Hyperopt 库自动执行超参数优化；这是一个使用超参数的不同组合重复训练和评估模型，直到找到最适合数据的值的过程。

反馈