Requêtes d’exploration de données

S’applique à : SQL Server 2019 et versions antérieures d’Analysis Services Azure Analysis Services Fabric/Power BI Premium

Important

L’exploration de données a été déconseillée dans SQL Server 2017 Analysis Services et est à présent abandonnée dans SQL Server 2022 Analysis Services. La documentation n’est pas mise à jour pour les fonctionnalités déconseillées et abandonnées. Pour en savoir plus, consultez Compatibilité descendante d’Analysis Services.

Les requêtes d'exploration de données sont utiles à de nombreuses fins. Vous pouvez :

  • Appliquer le modèle aux nouvelles données, pour créer des prédictions uniques ou multiples. Vous pouvez fournir des valeurs d'entrée sous forme de paramètres, ou dans un lot.

  • Obtenir un résumé statistique des données utilisées pour l'apprentissage.

  • Extraire les schémas et les règles, ou générer un profil du cas type qui représente un schéma dans le modèle.

  • Extraire les formules de régression et d'autres calculs qui expliquent les schémas.

  • Obtenir les cas qui conviennent à un schéma particulier.

  • Récupérer des détails sur les cas utilisés dans le modèle, y compris des données non utilisées dans l'analyse.

  • Recycler un modèle en ajoutant de nouvelles données ou effectuer une prédiction croisée.

Cette section fournit une vue d'ensemble des informations dont vous avez besoin pour utiliser les requêtes d'exploration de données. Elle décrit les types de requêtes que vous pouvez créer sur des objets d'exploration de données, présente les outils et les langages de requête et fournit des liens vers des exemples de requêtes que vous pouvez créer sur des modèles générés à l'aide des algorithmes fournis dans l'exploration de données SQL Server.

Fonctionnement des requêtes d'exploration de données

Outils et interfaces de requête

Requêtes pour différents types de modèles

Configuration requise

Fonctionnement des requêtes d'exploration de données

SQL Server Analysis Services l’exploration de données prend en charge les types de requêtes suivants :

Avant de créer des requêtes, il est recommandé de vous familiariser avec les différences qu'il existe entre les modèles créés à l'aide de chacun des algorithmes d'exploration de données fournis par SQL Server.

Outils et interfaces de requête

Vous pouvez générer des requêtes d'exploration de données en mode interactif à l'aide de l'un des outils de requête fournis par SQL Server. Le Générateur de requêtes de prédiction graphique est fourni dans SQL Server Data Tools et SQL Server Management Studio. Si vous n'avez pas utilisé le générateur de requêtes de prédiction auparavant, nous vous recommandons de suivre les étapes du Basic Data Mining Tutorial pour vous familiariser avec l'interface. Pour obtenir une vue d’ensemble rapide des étapes, consultez la section consacrée à la création d’une requête dans Créer une requête de prédiction à l’aide du Générateur de requêtes de prédiction.

Le générateur de requêtes de prédiction est utile pour démarrer des requêtes que vous personnaliserez ultérieurement. Vous pouvez ajouter facilement des sources de données et les mapper à des colonnes, puis basculer vers la vue DMX et personnaliser la requête en ajoutant une clause WHERE ou d'autres fonctions.

Une fois que vous êtes familiarisé avec les modèles d'exploration de données et la procédure de génération des requêtes, vous pouvez également écrire des requêtes directement à l'aide du langage d'extensions DMX (Data Mining Extensions). DMX est un langage de requête semblable à Transact-SQL, et que vous pouvez utiliser à partir de nombreux clients. DMX est l'outil de choix pour créer des prédictions personnalisées et des requêtes complexes. Pour une présentation de DMX, consultez Création et interrogation de modèles d’exploration de données avec DMX : Tutoriels (Analysis Services - Exploration de données).

Les éditeurs DMX sont fournis dans SQL Server Data Tools et SQL Server Management Studio. Vous pouvez également utiliser le générateur de requêtes de prédiction pour démarrer vos requêtes, puis changer la vue afin d'activer l'éditeur de texte et copier l'instruction DMX dans un autre client. Pour plus d’informations, consultez Outils de requête d’exploration de données.

Vous pouvez composer des instructions DMX par programmation et les envoyer de votre client au serveur SQL Server Analysis Services à l’aide d’AMO ou XMLA. Toutefois, DMX est le langage que vous devez utiliser pour créer des requêtes sur un modèle d'exploration de données.

Vous pouvez également interroger les métadonnées, les statistiques et une partie du contenu du modèle à l'aide de vues de gestion dynamique (DMV), basées sur les ensembles de lignes de schéma d'exploration de données. Ces vues DMV facilitent la récupération d'informations relatives au modèle en tapant des instructions SELECT ; toutefois, vous ne pouvez pas créer de prédictions. Pour plus d’informations sur les DMV prises en charge par SQL Server Analysis Services, consultez Utiliser des vues de gestion dynamique (DMV) pour surveiller Analysis Services.

Enfin, vous pouvez créer des requêtes d'exploration de données à utiliser dans les packages Integration Services, à l'aide de la Data Mining Query Taskou Data Mining Query Transformation. La tâche de flux de contrôle prend en charge plusieurs types de requêtes DMX, alors que la transformation de flux de données ne prend en charge que les requêtes qui utilisent des données dans le flux de données, à savoir les requêtes qui utilisent la syntaxe PREDICTION JOIN.

Requêtes pour différents types de modèle

L'algorithme utilisé lors de la création du modèle influence considérablement le type d'informations que vous pouvez obtenir à partir d'une requête d'exploration de données. La raison de ces différences s'explique par le fait que chaque algorithme traite les données d'une manière différente et stocke différents types de schémas. Par exemple, certains algorithmes créent des clusters ; d'autres créent des arborescences. Par conséquent, vous devrez peut-être utiliser la prédiction et les fonctions de requêtes spécialisées, selon le type de modèle avec lequel vous travaillez.

La liste suivante fournit un résumé des fonctions que vous pouvez utiliser dans les requêtes :

  • Fonctions de prédiction générales : la fonction Predict est polymorphe, ce qui signifie qu'elle fonctionne avec tous les types de modèle. Cette fonction détecte automatiquement le type de modèle que vous utilisez et vous invite à saisir des paramètres supplémentaires. Pour plus d’informations, consultez Prédire (DMX).

    Avertissement

    Tous les modèles ne sont pas utilisés pour effectuer des prédictions. Par exemple, vous pouvez créer un modèle de clustering qui n'a pas d'attribut prédictible. Toutefois, même si un modèle ne dispose pas d'attribut prédictible, vous pouvez créer des requêtes de prédiction qui retournent d'autres types d'informations utiles à partir du modèle.

  • Fonctions de prédiction personnalisées : chaque type de modèle fournit un ensemble de fonctions de prédiction conçues pour utiliser les schémas créés par l'algorithme.

    Par exemple, la fonction Lag est fournie pour les modèles de série chronologique, pour vous permettre de visualiser les données d'historique utilisées pour le modèle. Pour les modèles de clustering, les fonctions telles que ClusterDistance sont plus explicites.

    Pour plus d'informations sur les fonctions prises en charge pour chaque type de modèle, consultez les liens suivants :

    Vous pouvez également appeler des fonctions VBA ou créer vos propres fonctions. Pour plus d’informations, consultez Fonctions (DMX).

  • Statistiques générales : il existe plusieurs fonctions qui peuvent être utilisées avec presque n'importe quel type de modèle et retournent un ensemble standard de statistiques descriptives, telles que l'écart type.

    Par exemple, la fonction PredictHistogram retourne une table qui répertorie tous les états de la colonne spécifiée.

    Pour plus d’informations, consultez Fonctions de prédiction générales (DMX).

  • Statistiques personnalisées : des fonctions de prise en charge supplémentaires sont fournies pour chaque type de modèle, afin de générer des statistiques qui sont appropriées à la tâche analytique spécifique.

    Par exemple, lorsque vous utilisez un modèle de clustering, vous pouvez utiliser la fonction, PredictCaseLikelihoodpour retourner le score de vraisemblance associé à un certain cas et cluster. Toutefois, si vous avez créé un modèle de régression linéaire, vous serez plus intéressé à récupérer le coefficient et l'ordonnée à l'origine, ce que vous pouvez effectuer à l'aide d'une requête de contenu.

  • Fonctions de contenu de modèle : le contenu de tous les modèles est représenté dans un format standardisé qui vous permet de récupérer des informations avec une requête simple. Vous créez des requêtes sur le contenu du modèle à l'aide du langage DMX. Vous pouvez également obtenir un certain type de contenu de modèle à l'aide des ensembles de lignes du schéma d'exploration de données.

    Dans le contenu du modèle, la signification de chaque ligne ou nœud de la table retournée diffère selon le type d'algorithme utilisé pour générer le modèle, ainsi que le type de données de la colonne. Pour plus d’informations, consultez Requêtes de contenu (exploration de données).

Configuration requise

Avant de pouvoir créer une requête sur un modèle, le modèle d'exploration de données doit avoir été traité. Le traitement des objets SQL Server Analysis Services nécessite des autorisations spéciales. Pour plus d’informations sur le traitement des modèles d’exploration de données, consultez Exigences et considérations relatives au traitement (exploration de données).

Exécuter des requêtes sur un modèle d'exploration de données requiert différents niveaux d'autorisations, selon le type de requête que vous exécutez. Par exemple, l'extraction des données de structure ou de cas nécessite généralement des autorisations supplémentaires qui peuvent être définies sur l'objet de structure d'exploration de données ou sur un objet de modèle d'exploration de données.

Toutefois, si votre requête utilise des données externes et inclut des instructions telles que OPENROWSET ou OPENQUERY, la base de données que vous interrogez doit activer ces instructions, et vous devez disposer d'une autorisation sur les objets de base de données sous-jacents.

Pour plus d’informations sur les contextes de sécurité requis pour exécuter des requêtes d’exploration de données, consultez Vue d’ensemble de la sécurité (exploration de données)

Dans cette section

Les rubriques de cette section présentent chaque type de requête d’exploration de données plus en détail et fournissent des liens vers des exemples détaillés de création de requêtes sur des modèles mingin de données.

Prediction Queries (Data Mining)

Requêtes de contenu (Exploration de données)

Requêtes d'extraction (exploration de données)

Requêtes de définition des données (Exploration de données)

Outils de requête d’exploration de données

Utilisez ces liens pour apprendre à créer et à utiliser des requêtes d'exploration de données.

Tâches Liens
Afficher des didacticiels et des procédures pas à pas sur les requêtes d'exploration de données Leçon 6 : création et utilisation de prédictions (Didacticiel sur l'exploration de données de base)

Didacticiel DMX sur la prédiction de série chronologique
Utiliser des outils de requête d’exploration de données dans SQL Server Management Studio et SQL Server Data Tools Créer une requête DMX dans SQL Server Management Studio

Créer une requête de prédiction à l’aide du Générateur de requêtes de prédiction

Appliquer des fonctions de prédiction à un modèle

Modifier manuellement une requête de prédiction
Utiliser des données externes utilisées dans des requêtes de prédiction Choisir et mapper les données d'entrée pour une requête de prédiction

Choisir et mapper les données d'entrée pour une requête de prédiction
Utiliser les résultats de requêtes Afficher et enregistrer les résultats d'une requête de prédiction
Utiliser les modèles de requête DMX et XMLA fournis dans Management Studio Créer une requête singleton de prédiction à partir d'un modèle

Créer une requête d’exploration de données en utilisant XMLA

Utiliser des modèles Analysis Services dans SQL Server Management Studio
En savoir plus sur les requêtes de contenu et afficher des exemples Créer une requête de contenu sur un modèle d'exploration de données

Interroger les paramètres utilisés pour créer un modèle d'exploration de données

Requêtes de contenu (Exploration de données)
Définir des options de requête et résoudre les problèmes liés aux autorisations et aux requêtes Modifier la valeur du délai d'attente pour les requêtes d'exploration de données
Utiliser les composants d'exploration de données dans Integration Services Tâche de requête d’exploration de données

Transformation de requête d’exploration de données

Voir aussi

Algorithmes d'exploration de données (Analysis Services - Exploration de données)
Contenu du modèle d’exploration de données (Analysis Services - Exploration de données)