Esercitazione Sviluppare un modello predittivo in R con l’apprendimento automatico in SQL
Si applica a: SQL Server 2016 (13.x) e versioni successive Istanza gestita di SQL di Azure
In questa serie di esercitazioni in quattro parti si useranno R e un modello di Machine Learning nei servizi di Machine Learning per SQL Server oppure in cluster Big Data per stimare il numero di noleggi di sci.
In questa serie di esercitazioni in quattro parti si useranno R e un modello di Machine Learning nei servizi di Machine Learning per SQL Server per stimare il numero di noleggi di sci.
In questa serie di esercitazioni in quattro parti si useranno R e un modello di Machine Learning in R Services per SQL Server per stimare il numero di noleggi di sci.
In questa serie di esercitazioni in quattro parti si useranno R e un modello di Machine Learning nei servizi di Machine Learning per Istanza gestita di SQL di Azure per stimare il numero di noleggi di sci.
Si supponga di essere i proprietari di un'agenzia di noleggio di sci e di voler stimare il numero di noleggi richiesti in una data futura. Queste informazioni consentiranno di preparare correttamente le scorte, il personale e le strutture.
Nella prima parte di questa serie verranno configurati i prerequisiti. Nelle seconda e nella terza parte si svilupperanno alcuni script R in un notebook per preparare i dati ed eseguire il training di un modello di Machine Learning. Nella terza parte verranno quindi eseguiti gli script R nel database mediante stored procedure T-SQL.
In questo articolo si apprenderà come:
- Ripristinare un database di esempio
Nella seconda parte si apprenderà come caricare i dati da un database in un frame di dati Python e come preparare i dati in R.
Nella terza parte si apprenderà come eseguire il training di un modello di Machine Learning in R.
Nelle quarta parte si apprenderà come archiviare il modello in un database e quindi creare le stored procedure dagli script R sviluppati nella seconda e nella terza parte. Le stored procedure verranno quindi eseguite sul server per eseguire stime basate sui nuovi dati.
Prerequisiti
- Machine Learning Services per SQL Server - Per installare Machine Learning Services, vedere la guida all'installazione di Windows o la guida all'installazione di Linux. È anche possibile abilitare Machine Learning Services in cluster Big Data di SQL Server.
- Servizi di Machine Learning per SQL Server - Per installare i servizi di Machine Learning, vedere la Guida all'installazione di Windows.
- Installare R Services per SQL 2016 - Per installare R Services, vedere la Guida all'installazione di Windows.
Servizi di Machine Learning sull’istanza gestita di SQL di Azure. Per informazioni, vedere Panoramica di Machine Learning Services per Istanza gestita di SQL di Azure.
SQL Server Management Studio (SSMS): - Usare SSMS per ripristinare il database di esempio in Istanza gestita di SQL di Azure. Per il download, vedere Scaricare SQL Server Management Studio (SSMS).
IDE R - Questa esercitazione usa RStudio Desktop.
RODBC - Questo driver viene usato negli script R che verranno sviluppati in questa esercitazione. Se non è già installato, eseguirne l'installazione usando il comando R
install.packages("RODBC")
. Per altre informazioni su RODBC, vedere CRAN - Pacchetto RODBC.Strumento di query SQL: questa esercitazione presuppone che si usi Azure Data Studio. Per altre informazioni, vedere Come usare i notebook in Azure Data Studio.
Ripristinare il database di esempio
Il database di esempio usato in questa esercitazione è stato salvato in un file di backup del database .bak
che è possibile scaricare e usare.
Nota
Se si usa Machine Learning Services in cluster Big Data, vedere l'articolo su come ripristinare un database nell'istanza master di un cluster Big Data di SQL Server.
Scaricare il file TutorialDB.bak.
Seguire le istruzioni in Ripristinare un database da un file di backup in Azure Data Studio usando i dettagli seguenti:
- Importare i dati dal file
TutorialDB.bak
scaricato. - Assegnare al database di destinazione il nome
TutorialDB
.
- Importare i dati dal file
È possibile verificare che il database ripristinato esista eseguendo una query sulla tabella
dbo.rental_data
:USE TutorialDB; SELECT * FROM [dbo].[rental_data];
Scaricare il file TutorialDB.bak.
Seguire le istruzioni in Ripristinare un database in un'istanza gestita in SQL Server Management Studio, usando i dati seguenti:
- Importare i dati dal file
TutorialDB.bak
scaricato. - Assegnare al database di destinazione il nome
TutorialDB
.
- Importare i dati dal file
È possibile verificare che il database ripristinato esista eseguendo una query sulla tabella
dbo.rental_data
:USE TutorialDB; SELECT * FROM [dbo].[rental_data];
Pulire le risorse
Se non si intende continuare con questa esercitazione, eliminare il database TutorialDB.
Passaggio successivo
Nella prima parte di questa serie di esercitazioni sono stati completati i passaggi seguenti:
- Sono stati installati i prerequisiti
- È stato ripristinato un database di esempio
Per preparare i dati per il modello di Machine Learning, seguire la seconda parte di questa serie di esercitazioni: