Tutorial: Desenvolver um modelo preditivo no R com o machine learning do SQL

Aplica-se a: SQL Server 2016 (13.x) e versões posteriores Instância Gerenciada de SQL do Azure

Nesta série de tutoriais composta por quatro partes, você usará a linguagem R e um modelo de machine learning nos Serviços do Machine Learning do SQL Server ou em Clusters de Big Data para realizar a previsão do número de aluguéis de esquis.

Nesta série de tutoriais composta por quatro partes, você usará a linguagem R e um modelo de machine learning nos Serviços do Machine Learning do SQL Server para realizar a previsão do número de aluguéis de esquis.

Nesta série de tutoriais composta por quatro partes, você usará a linguagem R e um modelo de machine learning nos SQL Server R Services para realizar a previsão do número de aluguéis de esquis.

Nesta série de tutoriais composta por quatro partes, você usará a linguagem R e um modelo de machine learning nos Serviços do Machine Learning da Instância Gerenciada de SQL do Azure para realizar a previsão do número de aluguéis de esquis.

Imagine que você tenha um negócio de aluguel de esqui e queira prever o número de locações que você terá em uma data futura. Essas informações ajudarão você a preparar seu estoque, sua equipe e suas instalações.

Na primeira parte desta série, você se preparará com os pré-requisitos. Nas partes dois e três, você desenvolverá alguns scripts de R em um notebook para preparar seus dados e treinar um modelo de machine learning. Em seguida, na terceira parte, você executará esses scripts R em um banco de dados usando procedimentos armazenados T-SQL.

Neste artigo, você aprenderá a:

  • Restaurar um banco de dados de exemplo

Na parte dois, você aprenderá a carregar os dados de um banco de dados em uma estrutura do Python e a prepará-los no R.

Na parte três, você aprenderá a treinar um modelo de machine learning no R.

Na parte quatro, você aprenderá a armazenar o modelo em um banco de dados e, em seguida, criará procedimentos armazenados com base nos scripts do R desenvolvidos nas partes dois e três. Os procedimentos armazenados são executados no servidor para fazer previsões com base em novos dados.

Pré-requisitos

  • IDE para R: este tutorial usa o RStudio Desktop.

  • RODBC: este driver será usado nos scripts em R que você desenvolve neste tutorial. Se ele ainda não estiver instalado, instale-o usando o comando R install.packages("RODBC"). Para saber mais sobre o RODBC, confira CRAN – Pacote RODBC.

  • Ferramenta de consulta SQL – este tutorial pressupõe que você está usando o Azure Data Studio. Para obter mais informações, confira Como usar notebooks no Azure Data Studio.

Restaurar o banco de dados de exemplo

O banco de dados de amostra usado neste tutorial foi salvo em um arquivo de backup do banco de dados .bak para você efetuar o download e usar.

Observação

Se você estiver usando Serviços de Machine Learning em Clusters de Big Data, confira como Restaurar um banco de dados na instância mestra de cluster de Big Data do SQL Server.

  1. Baixe o arquivo TutorialDB.bak.

  2. Siga as instruções em Restaurar um banco de dados de um arquivo de backup no Azure Data Studio, usando estes detalhes:

    • Importe do arquivo TutorialDB.bak que você baixou.
    • Nomeie o banco de dados de destino TutorialDB.
  3. É possível verificar se o banco de dados restaurado existe consultando a tabela dbo.rental_data:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    
  1. Baixe o arquivo TutorialDB.bak.

  2. Siga as instruções descritas em Restaurar um banco de dados em uma Instância Gerenciada de SQL do Azure no SQL Server Management Studio usando estes detalhes:

    • Importe do arquivo TutorialDB.bak que você baixou.
    • Nomeie o banco de dados de destino TutorialDB.
  3. É possível verificar se o banco de dados restaurado existe consultando a tabela dbo.rental_data:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    

Limpar os recursos

Se você não continuar com este tutorial, exclua o banco de dados TutorialDB.

Próxima etapa

Na parte um desta série de tutoriais, você concluiu estas etapas:

  • Instalar os pré-requisitos
  • Restaurar um banco de dados de exemplo

Para preparar os dados para o modelo de machine learning, siga a parte dois desta série de tutoriais: