Tutorial: Desenvolver um modelo preditivo no R com o machine learning do SQL
Aplica-se a: SQL Server 2016 (13.x) e versões posteriores Instância Gerenciada de SQL do Azure
Nesta série de tutoriais composta por quatro partes, você usará a linguagem R e um modelo de machine learning nos Serviços do Machine Learning do SQL Server ou em Clusters de Big Data para realizar a previsão do número de aluguéis de esquis.
Nesta série de tutoriais composta por quatro partes, você usará a linguagem R e um modelo de machine learning nos Serviços do Machine Learning do SQL Server para realizar a previsão do número de aluguéis de esquis.
Nesta série de tutoriais composta por quatro partes, você usará a linguagem R e um modelo de machine learning nos SQL Server R Services para realizar a previsão do número de aluguéis de esquis.
Nesta série de tutoriais composta por quatro partes, você usará a linguagem R e um modelo de machine learning nos Serviços do Machine Learning da Instância Gerenciada de SQL do Azure para realizar a previsão do número de aluguéis de esquis.
Imagine que você tenha um negócio de aluguel de esqui e queira prever o número de locações que você terá em uma data futura. Essas informações ajudarão você a preparar seu estoque, sua equipe e suas instalações.
Na primeira parte desta série, você se preparará com os pré-requisitos. Nas partes dois e três, você desenvolverá alguns scripts de R em um notebook para preparar seus dados e treinar um modelo de machine learning. Em seguida, na terceira parte, você executará esses scripts R em um banco de dados usando procedimentos armazenados T-SQL.
Neste artigo, você aprenderá a:
- Restaurar um banco de dados de exemplo
Na parte dois, você aprenderá a carregar os dados de um banco de dados em uma estrutura do Python e a prepará-los no R.
Na parte três, você aprenderá a treinar um modelo de machine learning no R.
Na parte quatro, você aprenderá a armazenar o modelo em um banco de dados e, em seguida, criará procedimentos armazenados com base nos scripts do R desenvolvidos nas partes dois e três. Os procedimentos armazenados são executados no servidor para fazer previsões com base em novos dados.
Pré-requisitos
- Serviços de Machine Learning do SQL Server – Para instalar os Serviços de Machine Learning, confira o Guia de instalação do Windows ou o Guia de instalação do Linux. Você também pode habilitar Serviços de Machine Learning em Clusters de Big Data do SQL Server.
- Serviços do Machine Learning do SQL Server: para instalar os Serviços do Machine Learning, confira o guia de instalação para o Windows.
- R Services do SQL Server 2016: para instalar o R Services, confira o guia de instalação para o Windows.
Serviços do Machine Learning da Instância Gerenciada de SQL do Azure. Para obter informações, confira a Visão geral dos Serviços de Machine Learning da Instância Gerenciada de SQL do Azure.
SQL Server Management Studio (SSMS): use o SSMS para restaurar o banco de dados de amostra para a Instância Gerenciada de SQL do Azure. Para efetuar o download, confira SQL Server Management Studio.
IDE para R: este tutorial usa o RStudio Desktop.
RODBC: este driver será usado nos scripts em R que você desenvolve neste tutorial. Se ele ainda não estiver instalado, instale-o usando o comando R
install.packages("RODBC")
. Para saber mais sobre o RODBC, confira CRAN – Pacote RODBC.Ferramenta de consulta SQL – este tutorial pressupõe que você está usando o Azure Data Studio. Para obter mais informações, confira Como usar notebooks no Azure Data Studio.
Restaurar o banco de dados de exemplo
O banco de dados de amostra usado neste tutorial foi salvo em um arquivo de backup do banco de dados .bak
para você efetuar o download e usar.
Observação
Se você estiver usando Serviços de Machine Learning em Clusters de Big Data, confira como Restaurar um banco de dados na instância mestra de cluster de Big Data do SQL Server.
Baixe o arquivo TutorialDB.bak.
Siga as instruções em Restaurar um banco de dados de um arquivo de backup no Azure Data Studio, usando estes detalhes:
- Importe do arquivo
TutorialDB.bak
que você baixou. - Nomeie o banco de dados de destino
TutorialDB
.
- Importe do arquivo
É possível verificar se o banco de dados restaurado existe consultando a tabela
dbo.rental_data
:USE TutorialDB; SELECT * FROM [dbo].[rental_data];
Baixe o arquivo TutorialDB.bak.
Siga as instruções descritas em Restaurar um banco de dados em uma Instância Gerenciada de SQL do Azure no SQL Server Management Studio usando estes detalhes:
- Importe do arquivo
TutorialDB.bak
que você baixou. - Nomeie o banco de dados de destino
TutorialDB
.
- Importe do arquivo
É possível verificar se o banco de dados restaurado existe consultando a tabela
dbo.rental_data
:USE TutorialDB; SELECT * FROM [dbo].[rental_data];
Limpar os recursos
Se você não continuar com este tutorial, exclua o banco de dados TutorialDB.
Próxima etapa
Na parte um desta série de tutoriais, você concluiu estas etapas:
- Instalar os pré-requisitos
- Restaurar um banco de dados de exemplo
Para preparar os dados para o modelo de machine learning, siga a parte dois desta série de tutoriais: