Algorithmes d'exploration de données (Analysis Services – exploration de données)
Un algorithme d'exploration de données est un mécanisme qui crée un modèle d'exploration de données. Pour créer un modèle, un algorithme commence par analyser un jeu de données, puis recherche des modèles et des tendances spécifiques. L'algorithme utilise les résultats de cette analyse pour définir les paramètres du modèle d'exploration de données. Ensuite, ces paramètres sont appliqués au jeu de données entier pour extraire des modèles utilisables et des statistiques détaillées.
Le modèle d'exploration de données qu'un algorithme crée peut prendre des formes variées, dont les suivantes :
Un ensemble de règles qui décrivent la manière dont les produits sont regroupés dans une transaction.
Un arbre de décision qui prévoit si un client particulier achètera un produit.
Un modèle mathématique permettant de prévoir les ventes.
Un ensemble de clusters qui décrivent la manière dont les cas sont liés dans un jeu de données.
Microsoft SQL Server Analysis Services fournit plusieurs algorithmes à utiliser dans vos solutions d'exploration de données. Ces algorithmes représentent un sous-ensemble de tous les algorithmes qui peuvent être utilisés pour l'exploration de données. Vous pouvez également utiliser des algorithmes tiers conformes à la spécification OLE DB pour l'exploration de données. Pour plus d'informations sur les algorithmes tiers, consultez Algorithmes de plug-in.
Types d'algorithmes d'exploration de données
Analysis Services inclut les types d'algorithmes suivants :
Les algorithmes de classification prévoient une ou plusieurs variables discrètes, en fonction des autres attributs dans le jeu de données. Algorithme MDT (Microsoft Decision Trees) est un exemple d'algorithme de classification.
Les algorithmes de régression prévoient une ou plusieurs variables continues, telles que les bénéfices ou les pertes, en fonction d'autres attributs du jeu de données. Algorithme MTS (Microsoft Time Series) est un exemple d'algorithme de régression.
Les algorithmes de segmentation divisent les données en groupes, ou en clusters, d'éléments possédant des propriétés similaires. Algorithme de gestion de clusters Microsoft est un exemple d'algorithme de segmentation.
Les algorithmes d'association recherchent des corrélations entre différents attributs d'un jeu de données. L'application la plus courante de ce genre d'algorithme concerne la création de règles d'association, utilisables dans une analyse de panier d'achat. Algorithme Microsoft Association est un exemple d'algorithme d'association.
Les algorithmes d'analyse de séquence synthétisent les séquences ou épisodes fréquents dans des données, tels qu'un flux de chemin d'accès Web. Algorithme MSC (Microsoft Sequence Clustering) est un exemple d'algorithme d'analyse de séquence.
Application des algorithmes
Le choix du meilleur algorithme à utiliser pour une tâche professionnelle spécifique peut être un véritable défi. Vous pouvez utiliser des algorithmes différents pour effectuer la même tâche professionnelle, mais chaque algorithme produit un résultat différent et certains algorithmes peuvent produire plusieurs types de résultats. Par exemple, vous pouvez utiliser l'algorithme MDT (Microsoft Decision Trees) pas seulement pour des prédictions, mais aussi comme manière de réduire le nombre de colonnes dans un jeu de données, car l'arbre de décision peut identifier les colonnes qui n'affectent pas le modèle d'exploration de données final.
Vous n'êtes pas non plus tenu d'utiliser séparément les algorithmes. Dans une même solution d'exploration de données, vous pouvez utiliser certains algorithmes pour explorer les données, puis utiliser d'autres algorithmes pour prédire un résultat spécifique en fonction de ces données. Par exemple, vous pouvez utiliser un algorithme de clusters, qui reconnaît des motifs, pour diviser les données en groupes plus ou moins homogènes, puis utiliser les résultats pour créer un meilleur modèle d'arbre de décision. Vous pouvez utiliser plusieurs algorithmes au sein d'une même solution pour effectuer des tâches distinctes. Par exemple, vous pouvez utiliser un algorithme d'arbre de régression pour obtenir des informations de prévisions financières et un algorithme basé sur des règles pour effectuer une analyse du panier d'achat.
Les modèles d'exploration de données permettent de prédire des valeurs, de produire des synthèses de données et de rechercher des corrélations cachées. Pour vous aider à sélectionner des algorithmes pour votre solution d'exploration de données, le tableau ci-dessous fournit des suggestions sur les algorithmes à utiliser pour des tâches spécifiques.
Tâche |
Algorithmes Microsoft à utiliser |
---|---|
Prédiction d'un attribut discret. Par exemple, prédit si le destinataire d'une campagne de publipostage ciblée achètera un produit. |
Algorithme MDT (Microsoft Decision Trees) Algorithme MNB (Microsoft Naive Bayes) Algorithme de gestion de clusters Microsoft Algorithme MNN (Microsoft Neural Network) (Analysis Services - Exploration de données) |
Prévision d'un attribut continu. Par exemple, prévoit les ventes de l'année suivante. |
|
Prévision d'une séquence. Par exemple, effectue une analyse des parcours de visite du site Web d'une société. |
|
Recherche de groupes d'éléments communs dans des transactions. Par exemple, utilise l'analyse du panier d'achat pour suggérer des produits supplémentaires à un client. |
|
Recherche de groupes d'éléments similaires. Par exemple, segmente les données démographiques en groupes pour mieux comprendre les relations entre des attributs. |
Comme chaque modèle retourne un type différent de résultat, Analysis Services fournit une visionneuse distincte pour chaque algorithme. Lorsque vous parcourez un modèle d'exploration de données dans Analysis Services, le modèle s'affiche sous l'onglet Visionneuse de modèle d'exploration de données du concepteur d'exploration de données, à l'aide de la visionneuse appropriée pour ce modèle. Pour plus d'informations, consultez Affichage d'un modèle d'exploration de données.
Détails des algorithmes
La table suivante propose des liens vers les types d'informations disponibles pour chaque algorithme :
Description d'algorithme de base Fournit une explication de base de ce que l'algorithme fait et de son fonctionnement, avec un scénario d'entreprise où l'algorithme peut être utile.
Références techniques Dresse la liste des paramètres que vous pouvez configurer pour contrôler le comportement de l'algorithme et personnaliser les résultats dans le modèle. Apporte des détails techniques sur l'implémentation de l'algorithme, des conseils en matière de performances et les données requises.
Interrogation d'un modèle Fournit des exemples de requêtes que vous pouvez utiliser avec chaque type de modèle.Vous pouvez interroger un modèle pour en savoir plus sur les séquences du modèle ou pou faire des prédictions sur la base de ces séquences.
Contenu du modèle d'exploration de données Décrit comment les informations sont stockées dans une structure commune pour tous les types de modèle et explique comment interpréter les informations. Une fois que vous avez créé un modèle, vous pouvez l'explorer à l'aide des visionneuses fournies dans BI Development Studio ou vous pouvez écrire des requêtes pour retourner des informations directement à partir du contenu du modèle à l'aide de l'extension DMX.