Qu’est-ce que SQL Server Machine Learning Services avec Python et R ?

S’applique à : SQL Server 2017 (14.x) et versions ultérieures Azure SQL Managed Instance

Machine Learning Services est une fonctionnalité de SQL Server qui permet d’exécuter des scripts Python et R avec des données relationnelles. Vous pouvez utiliser des frameworks et des packages open source, ainsi que les packages Microsoft Python et R, pour l’analyse prédictive et le machine learning. Les scripts sont exécutés dans la base de données sans déplacer de données en dehors de SQL Server ou sur le réseau. Cet article présente les notions de base de SQL Server Machine Learning Services vous indique comment bien démarrer.

Notes

Machine Learning Services est aussi disponible dans Azure SQL Managed Instance. Pour plus l’apprentissage automatique sur d’autres plateformes SQL, consultez la documentation sur l’apprentissage automatique SQL.

Notes

Machine Learning Services est aussi disponible dans Azure SQL Managed Instance. Pour plus l’apprentissage automatique sur d’autres plateformes SQL, consultez la documentation sur l’apprentissage automatique SQL.

Pour exécuter Java dans SQL Server, consultez la documentation de l’extension de langage Java.

Pour exécuter C# dans SQL Server, consultez la documentation de l’extension de langage C#.

Exécuter des scripts Python et R dans SQL Server

SQL Server Machine Learning Services vous permet d’exécuter des scripts Python et R en base de données. Vous pouvez vous en servir pour préparer et nettoyer des données, effectuer l’ingénierie des fonctionnalités et entraîner, évaluer et déployer des modèles Machine Learning dans une base de données. La fonctionnalité exécute vos scripts là où résident les données, ce qui vous évite d’avoir à transférer les données vers un autre serveur à travers le réseau.

Vous pouvez exécuter des scripts Python et R sur une instance de SQL Server avec la procédure stockée sp_execute_external_script.

Les distributions de base de Python et de R sont incluses dans Machine Learning Services. Vous pouvez installer et utiliser des frameworks et des packages open source comme PyTorch, TensorFlow et scikit-learn, en plus des packages Microsoft.

Machine Learning Services utilise un framework d’extensibilité pour exécuter les scripts Python et R dans SQL Server. Pour en savoir plus, consultez :

Prise en main de Machine Learning Services

Versions de Python et de R

La liste suivante répertorie les versions de Python et de R incluses dans Machine Learning Services.

Version de SQL Server Mise à jour cumulée Version du runtime Python Versions du runtime R
SQL Server 2022* RTM et versions ultérieures 3.10.2 4.2.0
SQL Server 2019 RTM et versions ultérieures 3.7.1 3.5.2
SQL Server 2017 CU22 et versions ultérieures 3.5.2 et 3.7.2 3.3.3 et 3.5.2
SQL Server 2017 RTM - CU21 3.5.2 3.3.3
SQL Server 2016 Voir la version de R

* Pour les versions prises en charge de R et Python et des packages RevoScaleR et revoscalepy, consultez Installer SQL Server 2022 Machine Learning Services (Python et R) sur Windows ou Installer SQL Server Machine Learning Services (Python et R) sur Linux.

Packages Python et R

Vous pouvez utiliser des frameworks et des packages open source, en plus des packages d’entreprise Microsoft. Les packages Python et R open source les plus courants sont préinstallés dans Machine Learning Services.

Notes

À compter de SQL Server 2022 (16.x), les runtimes pour R, Python et Java ne sont plus installés avec le programme d’installation de SQL. Au lieu de cela, installez le(s) runtime(s) et les packages personnalisés R et/ou Python souhaités. Pour plus d’informations, consultez Installer SQL Server 2022 Machine Learning Services sur Windows ou Installer SQL Server Machine Learning Services (Python et R) sur Linux.

Les packages Python et R suivants de Microsoft sont également inclus à l’installation :

Langage Package Description
Python revoscalepy Package principal pour créer du code Python scalable : transformations et manipulations de données, totalisation statistique, visualisation et nombreuses formes de modélisation. De plus, les fonctions de ce package distribuent automatiquement les charges de travail entre les cœurs disponibles pour un traitement parallèle.
Python microsoftml S’applique uniquement à SQL Server 2016, SQL Server 2017 et SQL Server 2019. Ajoute des algorithmes de machine learning pour créer des modèles personnalisés pour l’analyse des textes, l’analyse des images et l’analyse des sentiments.
R RevoScaleR Package principal pour créer du code Python scalable : transformations et manipulations de données, totalisation statistique, visualisation et nombreuses formes de modélisation. De plus, les fonctions de ce package distribuent automatiquement les charges de travail entre les cœurs disponibles pour un traitement parallèle.
R MicrosoftML (R) S’applique uniquement à SQL Server 2016, SQL Server 2017 et SQL Server 2019. Ajoute des algorithmes de machine learning pour créer des modèles personnalisés pour l’analyse des textes, l’analyse des images et l’analyse des sentiments.
R olapR S’applique uniquement à SQL Server 2016, SQL Server 2017 et SQL Server 2019. Fonctions R utilisées pour les requêtes MDX sur un cube OLAP SQL Server Analysis Services.
R sqlrutils S’applique uniquement à SQL Server 2016, SQL Server 2017 et SQL Server 2019. Mécanisme permettant d’utiliser les scripts R dans une procédure stockée T-SQL, d’inscrire cette procédure auprès d’une base de données et d’exécuter la procédure stockée à partir d’un environnement de développement R.
R Microsoft R Open (supprimé) S’applique à : SQL Server 2016, SQL Server 2017 et SQL Server 2019.

Microsoft R Open (MRO) était la distribution améliorée de R fournie par Microsoft.

Pour plus d’informations sur les packages installés avec Machine Learning Services et sur l’installation d’autres packages, consultez :

Étapes suivantes