Algorithmes d'exploration de données (Analysis Services – exploration de données)

Un algorithme d'exploration de données est un mécanisme qui crée un modèle d'exploration de données. Pour créer un modèle, un algorithme commence par analyser un jeu de données, puis recherche des modèles et des tendances spécifiques. L'algorithme utilise les résultats de cette analyse pour définir les paramètres du modèle d'exploration de données. Ensuite, ces paramètres sont appliqués au jeu de données entier pour extraire des modèles utilisables et des statistiques détaillées.

Le modèle d'exploration de données qu'un algorithme crée peut prendre des formes variées, dont les suivantes :

  • Un ensemble de règles qui décrivent la manière dont les produits sont regroupés dans une transaction.

  • Un arbre de décision qui prévoit si un client particulier achètera un produit.

  • Un modèle mathématique permettant de prévoir les ventes.

  • Un ensemble de clusters qui décrivent la manière dont les cas sont liés dans un jeu de données.

Microsoft SQL Server Analysis Services fournit plusieurs algorithmes à utiliser dans vos solutions d'exploration de données. Ces algorithmes représentent un sous-ensemble de tous les algorithmes qui peuvent être utilisés pour l'exploration de données. Vous pouvez également utiliser des algorithmes tiers conformes à la spécification OLE DB pour l'exploration de données. Pour plus d'informations sur les algorithmes tiers, consultez Algorithmes de plug-in.

Types d'algorithmes d'exploration de données

Analysis Services inclut les types d'algorithmes suivants :

  • Les algorithmes de classification prévoient une ou plusieurs variables discrètes, en fonction des autres attributs dans le jeu de données. Algorithme MDT (Microsoft Decision Trees) est un exemple d'algorithme de classification.

  • Les algorithmes de régression prévoient une ou plusieurs variables continues, telles que les bénéfices ou les pertes, en fonction d'autres attributs du jeu de données. Algorithme MTS (Microsoft Time Series) est un exemple d'algorithme de régression.

  • Les algorithmes de segmentation divisent les données en groupes, ou en clusters, d'éléments possédant des propriétés similaires. Algorithme de gestion de clusters Microsoft est un exemple d'algorithme de segmentation.

  • Les algorithmes d'association recherchent des corrélations entre différents attributs d'un jeu de données. L'application la plus courante de ce genre d'algorithme concerne la création de règles d'association, utilisables dans une analyse de panier d'achat. Algorithme Microsoft Association est un exemple d'algorithme d'association.

  • Les algorithmes d'analyse de séquence synthétisent les séquences ou épisodes fréquents dans des données, tels qu'un flux de chemin d'accès Web. Algorithme MSC (Microsoft Sequence Clustering) est un exemple d'algorithme d'analyse de séquence.

Application des algorithmes

Le choix du meilleur algorithme à utiliser pour une tâche professionnelle spécifique peut être un véritable défi. Vous pouvez utiliser des algorithmes différents pour effectuer la même tâche professionnelle, mais chaque algorithme produit un résultat différent et certains algorithmes peuvent produire plusieurs types de résultats. Par exemple, vous pouvez utiliser l'algorithme MDT (Microsoft Decision Trees) pas seulement pour des prédictions, mais aussi comme manière de réduire le nombre de colonnes dans un jeu de données, car l'arbre de décision peut identifier les colonnes qui n'affectent pas le modèle d'exploration de données final.

Vous n'êtes pas non plus tenu d'utiliser séparément les algorithmes. Dans une même solution d'exploration de données, vous pouvez utiliser certains algorithmes pour explorer les données, puis utiliser d'autres algorithmes pour prédire un résultat spécifique en fonction de ces données. Par exemple, vous pouvez utiliser un algorithme de clusters, qui reconnaît des motifs, pour diviser les données en groupes plus ou moins homogènes, puis utiliser les résultats pour créer un meilleur modèle d'arbre de décision. Vous pouvez utiliser plusieurs algorithmes au sein d'une même solution pour effectuer des tâches distinctes. Par exemple, vous pouvez utiliser un algorithme d'arbre de régression pour obtenir des informations de prévisions financières et un algorithme basé sur des règles pour effectuer une analyse du panier d'achat.

Les modèles d'exploration de données permettent de prédire des valeurs, de produire des synthèses de données et de rechercher des corrélations cachées. Pour vous aider à sélectionner des algorithmes pour votre solution d'exploration de données, le tableau ci-dessous fournit des suggestions sur les algorithmes à utiliser pour des tâches spécifiques.

Tâche

Algorithmes Microsoft à utiliser

Prédiction d'un attribut discret.

Par exemple, prédit si le destinataire d'une campagne de publipostage ciblée achètera un produit.

Algorithme MDT (Microsoft Decision Trees)

Algorithme MNB (Microsoft Naive Bayes)

Algorithme de gestion de clusters Microsoft

Algorithme MNN (Microsoft Neural Network) (Analysis Services - Exploration de données)

Prévision d'un attribut continu.

Par exemple, prévoit les ventes de l'année suivante.

Algorithme MDT (Microsoft Decision Trees)

Algorithme MTS (Microsoft Time Series)

Prévision d'une séquence.

Par exemple, effectue une analyse des parcours de visite du site Web d'une société.

Algorithme MSC (Microsoft Sequence Clustering)

Recherche de groupes d'éléments communs dans des transactions.

Par exemple, utilise l'analyse du panier d'achat pour suggérer des produits supplémentaires à un client.

Algorithme Microsoft Association

Algorithme MDT (Microsoft Decision Trees)

Recherche de groupes d'éléments similaires.

Par exemple, segmente les données démographiques en groupes pour mieux comprendre les relations entre des attributs.

Algorithme de gestion de clusters Microsoft

Algorithme MSC (Microsoft Sequence Clustering)

Comme chaque modèle retourne un type différent de résultat, Analysis Services fournit une visionneuse distincte pour chaque algorithme. Lorsque vous parcourez un modèle d'exploration de données dans Analysis Services, le modèle s'affiche sous l'onglet Visionneuse de modèle d'exploration de données du concepteur d'exploration de données, à l'aide de la visionneuse appropriée pour ce modèle. Pour plus d'informations, consultez Affichage d'un modèle d'exploration de données.

Détails des algorithmes

La table suivante propose des liens vers les types d'informations disponibles pour chaque algorithme :

  • Description d'algorithme de base   Fournit une explication de base de ce que l'algorithme fait et de son fonctionnement, avec un scénario d'entreprise où l'algorithme peut être utile.

  • Références techniques   Dresse la liste des paramètres que vous pouvez configurer pour contrôler le comportement de l'algorithme et personnaliser les résultats dans le modèle. Apporte des détails techniques sur l'implémentation de l'algorithme, des conseils en matière de performances et les données requises.

  • Interrogation d'un modèle   Fournit des exemples de requêtes que vous pouvez utiliser avec chaque type de modèle.Vous pouvez interroger un modèle pour en savoir plus sur les séquences du modèle ou pou faire des prédictions sur la base de ces séquences.

  • Contenu du modèle d'exploration de données    Décrit comment les informations sont stockées dans une structure commune pour tous les types de modèle et explique comment interpréter les informations.    Une fois que vous avez créé un modèle, vous pouvez l'explorer à l'aide des visionneuses fournies dans BI Development Studio ou vous pouvez écrire des requêtes pour retourner des informations directement à partir du contenu du modèle à l'aide de l'extension DMX.

Description d'algorithme de base

Références techniques

Interrogation

Contenu du modèle d'exploration de données

Algorithme Microsoft Association

Références techniques relatives à l'algorithme Microsoft Association-

Interrogation d'un modèle d'association (Analysis Services - Exploration de données)

Contenu du modèle d'exploration de données pour les modèles d'association (Analysis Services - Exploration de données)

Algorithme de gestion de clusters Microsoft

Références techniques relatives à l'algorithme de gestion de clusters Microsoft

Interrogation d'un modèle de clustering (Analysis Services - Exploration de données)

Contenu du modèle d'exploration de données pour les modèles de clustering (Analysis Services - Exploration de données)

Algorithme MDT (Microsoft Decision Trees)

Références techniques relatives à l'algorithme MDT (Microsoft Decision Trees)

Interrogation d'un modèle d'arbre de décision (Analysis Services - Exploration de données)

Contenu du modèle d'exploration de données pour les modèles d'arbre de décision (Analysis Services - Exploration de données)

Algorithme MLR (Microsoft Linear Regression)

Références techniques relatives à l'algorithme MLR (Microsoft Linear Regression)

Interrogation d'un modèle de régression linéaire (Analysis Services - Exploration de données)

Contenu du modèle d'exploration de données pour les modèles de régression linéaire (Analysis Services - Exploration de données)

Algorithme MLR (Microsoft Logistic Regression)

Références techniques relatives à l'algorithme MLR (Microsoft Logistic Regression)

Interrogation d'un modèle de régression logistique (Analysis Services - Exploration de données)

Contenu du modèle d'exploration de données pour les modèles de régression logistique (Analysis Services - Exploration de données)

Algorithme MNB (Microsoft Naive Bayes)

Références techniques relatives à l'algorithme MNB (Microsoft Naive Bayes)

Interrogation d'un modèle Naive Bayes (Analysis Services - Exploration de données)

Contenu du modèle d'exploration de données pour les modèles Naive Bayes (Analysis Services - Exploration de données)

Algorithme MNN (Microsoft Neural Network) (Analysis Services - Exploration de données)

Références techniques relatives à l'algorithme MNN (Microsoft Neural Network)

Interrogation d'un modèle de réseau neuronal (Analysis Services - Exploration de données)

Contenu du modèle d'exploration de données pour les modèles de réseau neuronal (Analysis Services - Exploration de données)

Algorithme MSC (Microsoft Sequence Clustering)

Références techniques relatives à l'algorithme Microsoft Sequence Clustering (Analysis Services - Exploration de données)

Interrogation d'un modèle Sequence Clustering (Analysis Services - Exploration de données)

Contenu du modèle d'exploration de données pour les modèles Sequence Clustering (Analysis Services - Exploration de données)

Algorithme MTS (Microsoft Time Series)

Références techniques relatives à l'algorithme MTS (Microsoft Time Series)

Interrogation d'un modèle de série chronologique (Analysis Services - Exploration de données)

Contenu du modèle d'exploration de données pour les modèles de séries chronologiques (Analysis Services - Exploration de données)