第三方在线存储

本文介绍如何使用第三方在线存储来实时提供特征值。 还可以使用 Databricks 联机表提供实时特征服务,所需的设置要少得多。 请参阅 Databricks 联机表

通过实时服务,可将特征表发布到低延迟数据库,并将模型或特征规格部署到 REST 终结点。

Databricks 特征存储还支持自动特征查找。 在这种情况下,客户端提供的输入值包括仅在推理时可用的值。 该模型会合并逻辑,自动从提供的输入值中提取所需的特征值。

此图说明了 MLflow 与用于实时服务的特征存储组件之间的关系。

使用联机查找的特征存储工作流

Databricks 特征存储支持以下联机存储:

联机存储提供者 使用 Unity Catalog 中的特征工程进行发布 使用工作区特征存储进行发布 旧版 MLflow 模型服务中的特征查找 模型服务中的特征查找
Azure Cosmos DB [1] X X(特征存储客户端 v0.5.0 及更高版本) X X
Azure MySQL(单一服务器) X X
Azure SQL Server X

[1] 有关 Cosmos DB 要求的重要信息,请参阅 Cosmos DB 兼容性说明

开始使用联机存储

若要开始使用联机存储,请参阅以下文章: