Repositório de recursos do espaço de trabalho (Legado)

Nota

Esta documentação abrange o repositório de recursos do espaço de trabalho. Use esta página somente se seu espaço de trabalho não estiver habilitado para o Catálogo Unity.

A Databricks recomenda o uso da Engenharia de Recursos no Unity Catalog. O repositório de recursos do espaço de trabalho será preterido no futuro.

Por que usar o repositório de recursos de espaço de trabalho?

O repositório de recursos de espaço de trabalho é totalmente integrado com outros componentes do Azure Databricks.

  • Capacidade de descoberta. A interface do usuário do Feature Store, acessível a partir do espaço de trabalho Databricks, permite navegar e pesquisar recursos existentes.
  • Linhagem. Quando você cria uma tabela de recursos no Azure Databricks, as fontes de dados usadas para criar a tabela de recursos são salvas e acessíveis. Para cada recurso em uma tabela de recursos, você também pode acessar os modelos, blocos de anotações, trabalhos e pontos de extremidade que usam o recurso.
  • Integração com pontuação e serviço de modelos. Quando você usa recursos do Feature Store para treinar um modelo, o modelo é empacotado com metadados de recurso. Quando você usa o modelo para pontuação em lote ou inferência online, ele recupera automaticamente os recursos do Feature Store. O chamador não precisa saber sobre eles ou incluir lógica para procurar ou unir recursos para pontuar novos dados. Isso torna a implantação e as atualizações do modelo muito mais fáceis.
  • Pesquisas point-in-time. O Feature Store suporta séries cronológicas e casos de uso baseados em eventos que exigem correção point-in-time.

Como funciona o repositório de recursos do espaço de trabalho?

O fluxo de trabalho típico de aprendizado de máquina usando o Feature Store segue este caminho:

  1. Escreva código para converter dados brutos em recursos e crie um Spark DataFrame contendo os recursos desejados.
  2. Escreva o DataFrame como uma tabela de recursos no repositório de recursos do espaço de trabalho.
  3. Treine um modelo usando recursos da loja de recursos. Quando você faz isso, o modelo armazena as especificações dos recursos usados para treinamento. Quando o modelo é usado para inferência, ele une automaticamente recursos das tabelas de recursos apropriadas.
  4. Modelo de registo no Registo Modelo.

Agora você pode usar o modelo para fazer previsões sobre novos dados. Para casos de uso em lote, o modelo recupera automaticamente os recursos necessários do Feature Store.

Fluxo de trabalho do Feature Store para casos de uso de aprendizado de máquina em lote.

Para casos de uso de atendimento em tempo real, publique os recursos em uma loja online. Consulte Lojas online de terceiros.

No momento da inferência, o modelo lê recursos pré-computados da loja online e os une com os dados fornecidos na solicitação do cliente ao ponto de extremidade de serviço do modelo.

Fluxo do Repositório de Recursos para modelos de aprendizado de máquina que são servidos.

Começar a usar o repositório de recursos do espaço de trabalho

Para começar, experimente estes blocos de notas de exemplo. O bloco de anotações básico orienta você sobre como criar uma tabela de recursos, usá-la para treinar um modelo e, em seguida, executar a pontuação em lote usando a pesquisa automática de recursos. Ele também apresenta a interface do usuário de engenharia de recursos e mostra como você pode usá-la para pesquisar recursos e entender como os recursos são criados e usados.

Bloco de anotações de exemplo do Repositório de Recursos de Espaço de Trabalho Básico

Obter o bloco de notas

O bloco de anotações de exemplo de táxi ilustra o processo de criação de recursos, atualizando-os e usando-os para treinamento de modelo e inferência em lote.

Espaço de trabalho Repositório de recursos de táxi exemplo de bloco de anotações

Obter o bloco de notas

Tipos de dados suportados:

Para tipos de dados suportados, consulte Tipos de dados suportados.