Tutoriel Python : Prédire la location de skis avec la régression linéaire et le Machine Learning SQL

S’applique à : SQL Server 2017 (14.x) et versions ultérieures Azure SQL Managed Instance

Dans cette série de tutoriels en quatre parties, vous allez utiliser Python et la régression linéaire dans SQL Server Machine Learning Services ou sur des clusters Big Data de SQL Server 2019 pour prédire le nombre de locations de skis. Le tutoriel utilise un notebook Python dans Azure Data Studio.

Dans ce tutoriel en quatre parties, vous allez utiliser Python et la régression linéaire dans SQL Server Machine Learning Services pour prédire le nombre de locations de ski. Le tutoriel utilise un notebook Python dans Azure Data Studio.

Dans cette série de quatre tutoriels, vous allez utiliser Python et la régression linéaire dans Azure SQL Managed Instance Machine Learning Services pour prédire le nombre de locations de ski. Le tutoriel utilise un notebook Python dans Azure Data Studio.

Imaginez que vous êtes une entreprise de location de ski et que vous souhaitez prédire le nombre de locations à une date ultérieure. Ces informations vous aideront à préparer votre inventaire, votre personnel et vos installations.

Dans la première partie de ce tutoriel, vous allez configurer les composants requis. Dans les parties 2 et 3, vous allez développer des scripts Python dans un notebook pour préparer vos données et effectuer l’apprentissage d’un modèle Machine Learning. Ensuite, dans la troisième partie, vous exécuterez ces scripts Python à l’intérieur de la base de données à l’aide de procédures stockées T-SQL.

Dans cet article, vous allez apprendre à :

  • Importer un exemple de base de données

Dans la deuxième partie, vous allez apprendre à charger les données à partir d’une base de données dans une trame de données Python et à préparer les données dans Python.

Dans la troisième partie, vous apprendrez à effectuer la formation d’un modèle de régression linéaire dans Python.

Dans la quatrième partie, vous allez apprendre à stocker le modèle dans une base de données, puis à créer des procédures stockées à partir des scripts Python que vous avez développés dans les parties 2 et 3. Les procédures stockées sont exécutées sur le serveur pour effectuer des prédictions en fonction de nouvelles données.

Prérequis

  • Environnement de développement intégré (IDE) Python : ce tutoriel utilise un notebook Python dans Azure Data Studio. Pour en savoir plus, consultez Comment utiliser les notebooks dans Azure Data Studio.

  • Outil de requête SQL : ce tutoriel part du principe que vous utilisez Azure Data Studio.

  • Packages Python supplémentaires : les exemples de cette série de tutoriel utilisent les packages Python suivants, qui peuvent ne pas être installés par défaut :

    • pandas
    • pyodbc
    • scikit-learn

    Pour installer ces packages :

    1. Dans votre notebook Azure Data Studio, sélectionnez Gérer les packages.
    2. Dans le volet Gérer les packages, sélectionnez l’onglet Ajouter nouveau.
    3. Pour chacun des packages suivants, entrez le nom du package, sélectionnez Rechercher, puis Installer.

    Vous pouvez également ouvrir une invite de commandes, modifier le chemin d’installation de la version de Python que vous utilisez dans Azure Data Studio (par exemple, cd %LocalAppData%\Programs\Python\Python37-32), puis exécuter pip install pour chaque package.

Restaurer les exemples de base de données

L’exemple de base de données utilisé dans ce tutoriel a été enregistré dans un fichier de sauvegarde de base de données .bak que vous pouvez télécharger et utiliser.

Remarque

Si vous utilisez Machine Learning Services sur des clusters Big Data de SQL Server 2019, consultez Restaurer une base de données dans l’instance principale du cluster Big Data.

  1. Téléchargez le fichier TutorialDB.bak.

  2. Suivez les instructions dans Restaurer une base de données à partir d’un fichier de sauvegarde dans Azure Data Studio, en utilisant les informations suivantes :

    • Importez à partir du fichier TutorialDB.bak que vous avez téléchargé.
    • Nommez la base de données cibleTutorialDB.
  3. Vous pouvez vérifier que la base de données restaurée existe en interrogeant la table dbo.rental_data :

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    
  1. Téléchargez le fichier TutorialDB.bak.

  2. Suivez les instructions de Restauration d’une base de données sur Azure SQL Managed Instance dans SQL Server Management Studio, en utilisant les informations suivantes :

    • Importez à partir du fichier TutorialDB.bak que vous avez téléchargé.
    • Nommez la base de données cibleTutorialDB.
  3. Vous pouvez vérifier que la base de données restaurée existe en interrogeant la table dbo.rental_data :

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    

Nettoyer les ressources

Si vous ne poursuivez pas ce tutoriel, supprimez la base de données TutorialDB.

Étape suivante

Dans la première partie de cette série de tutoriels, vous avez effectué les étapes suivantes :

  • Installer les prérequis
  • Importer un exemple de base de données

Pour préparer les données de la base de données TutorialDB, suivez la deuxième partie de cette série de tutoriels :