Tutorial do Python: Prever o aluguel de esquis com regressão linear com aprendizado de máquina do SQL

Aplica-se a: SQL Server 2017 (14.x) e versões posteriores Instância Gerenciada de SQL do Azure

Nesta série de tutoriais de quatro partes, você usará a regressão linear e o Python nos Serviços de Machine Learning do SQL Server ou nos Clusters de Big Data do SQL Server 2019 para prever o número de aluguéis de esqui. O tutorial usa um notebook do Python no Azure Data Studio.

Nesta séries de tutoriais de quatro partes, você usará a regressão linear e o Python nos Serviços de Machine Learning do SQL Server para prever o número de locações de esqui. O tutorial usa um notebook do Python no Azure Data Studio.

Nesta séries de tutoriais de quatro partes, você usará a regressão linear e o Python nos Serviços de Machine Learning da Instância Gerenciada de SQL do Azure para prever o número de locações de esqui. O tutorial usa um notebook do Python no Azure Data Studio.

Imagine que você é proprietário de uma empresa de aluguel de esquis e deseja realizar a previsão do número de aluguéis que terá em uma data futura. Essas informações ajudam você a preparar seu estoque, sua equipe e suas instalações.

Na primeira parte desta série, você se preparará com os pré-requisitos. Nas partes dois e três, você desenvolverá alguns scripts do Python em um notebook para preparar seus dados e treinar um modelo de machine learning. Em seguida, na parte três, você executará esses scripts Python dentro do banco de dados usando procedimentos armazenados de T-SQL.

Neste artigo, você aprenderá a:

  • Importar um banco de dados de exemplo

Na parte dois, você aprenderá a carregar os dados de um banco de dados em uma estrutura do Python e a prepará-los no Python.

Na parte três, você aprenderá a treinar um modelo de regressão linear no Python.

Na parte quatro, você aprenderá a armazenar o modelo em um banco de dados e, em seguida, criará procedimentos armazenados com base nos scripts do Python desenvolvidos nas partes dois e três. Os procedimentos armazenados serão executados no servidor para fazer previsões com base em novos dados.

Pré-requisitos

  • IDE para Python: este tutorial usa um notebook Python no Azure Data Studio. Para obter mais informações, confira Como usar notebooks no Azure Data Studio.

  • Ferramenta de consulta SQL: este tutorial pressupõe que você esteja usando o Azure Data Studio.

  • Pacotes adicionais para Python: os exemplos nesta série de tutoriais usam os seguintes pacotes para Python que podem não ser instalados por padrão:

    • pandas
    • pyodbc
    • scikit-learn

    Para instalar esses pacotes:

    1. No notebook do Azure Data Studio, selecione Gerenciar Pacotes.
    2. No painel Gerenciar Pacotes, selecione a guia Adicionar Novo.
    3. Para cada pacote a seguir, insira o nome do pacote, selecione Pesquisar e Instalar.

    Como alternativa, você pode abrir um Prompt de Comando, alterar para o caminho de instalação da versão do Python usada no Azure Data Studio (por exemplo, cd %LocalAppData%\Programs\Python\Python37-32) e executar pip install para cada pacote.

Restaurar o banco de dados de exemplo

O banco de dados de amostra usado neste tutorial foi salvo em um arquivo de backup do banco de dados .bak para você efetuar o download e usar.

Observação

Se você estiver usando Serviços de Machine Learning em Clusters de Big Data do SQL Server 2019, confira como Restaurar um banco de dados na instância mestra de cluster de big data.

  1. Baixe o arquivo TutorialDB.bak.

  2. Siga as instruções em Restaurar um banco de dados de um arquivo de backup no Azure Data Studio, usando estes detalhes:

    • Importe do arquivo TutorialDB.bak que você baixou.
    • Nomeie o banco de dados de destino TutorialDB.
  3. É possível verificar se o banco de dados restaurado existe consultando a tabela dbo.rental_data:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    
  1. Baixe o arquivo TutorialDB.bak.

  2. Siga as instruções descritas em Restaurar um banco de dados em uma Instância Gerenciada de SQL do Azure no SQL Server Management Studio usando estes detalhes:

    • Importe do arquivo TutorialDB.bak que você baixou.
    • Nomeie o banco de dados de destino TutorialDB.
  3. É possível verificar se o banco de dados restaurado existe consultando a tabela dbo.rental_data:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    

Limpar os recursos

Se você não continuar com este tutorial, exclua o banco de dados TutorialDB.

Próxima etapa

Na parte um desta série de tutoriais, você concluiu estas etapas:

  • Instalar os pré-requisitos
  • Importar um banco de dados de exemplo

Para preparar os dados do banco de dados TutorialDB, siga a parte dois desta série de tutoriais: