Leçon 2 : Ajout de modèles d'exploration de données à la structure d'exploration de données Market Basket

Dans cette leçon, vous allez ajouter deux modèles d'exploration de données à la structure d'exploration de données Market Basket que vous avez créée au cours de la Leçon 1 : Création de la structure d'exploration de données Market Basket. Ces modèles d'exploration de données vous permettent de créer des prédictions.

Pour prévoir les types de produits que des clients sont susceptibles d'acheter en même temps, vous allez créer deux modèles d'exploration de données à l'aide de l'Algorithme Microsoft Association et de deux valeurs distinctes pour le paramètre MINIMUM_PROBABILTY.

MINIMUM_PROBABILTY est un paramètre d'algorithme Microsoft Association qui permet de déterminer le nombre de règles qu'un modèle d'exploration de données doit contenir en définissant la probabilité minimale dont la règle doit disposer. Par exemple, la valeur 0,4 spécifie qu'une règle peut être générée uniquement si la combinaison des produits que la règle décrit présente une probabilité d'occurrence d'au moins quarante pour cent.

Vous examinerez l'effet de la modification du paramètre MINIMUM_PROBABILTY dans une leçon ultérieure.

Instruction ALTER MINING STRUCTURE

Pour ajouter un modèle d'exploration de données contenant une table imbriquée à la structure d'exploration de données, vous devez utiliser l'instruction ALTER MINING STRUCTURE (DMX). Le code de cette instruction peut être divisé selon les sections suivantes :

  • Identification de la structure d'exploration de données

  • Attribution d'un nom au modèle d'exploration de données

  • Définition de la colonne clé

  • Définition des colonnes d'entrée et des colonnes prédictibles

  • Définition des colonnes de la table imbriquée

  • Identification des modifications d'algorithme et de paramètre

L'exemple générique suivant utilise l'instruction ALTER MINING STRUCTURE qui ajoute un modèle d'exploration de données à une structure comportant des colonnes de tables imbriquées :

ALTER MINING STRUCTURE [<Mining Structure Name>]
ADD MINING MODEL [<Mining Model Name>]
(
    [<key column>],
    <mining model column> <usage>,
    <table columns>
    (  [<nested key column>],
       <nested mining model columns> )
) USING <algorithm>( <algorithm parameters> )

La première ligne du code identifie la structure d'exploration de données existante à laquelle le modèle d'exploration de données sera ajouté :

ALTER MINING STRUCTURE [<mining structure name>]

La ligne suivante du code désigne le modèle d'exploration de données qui sera ajouté à la structure d'exploration de données :

ADD MINING MODEL [<mining model name>]

Pour plus d'informations sur la manière d'attribuer un nom à un objet dans l'extension DMX (Data Mining Extensions), consultez Identificateurs (DMX).

Les lignes suivantes du code définissent les colonnes de la structure d'exploration de données employées dans le modèle d'exploration de données :

[<key column>],
<mining model columns> <usage>,

Vous pouvez utiliser uniquement des colonnes qui existent déjà dans la structure d'exploration de données.

La première colonne dans la liste de colonnes de modèle d'exploration de données doit être la colonne clé dans la structure d'exploration de données. Toutefois, il n'est pas nécessaire de taper KEY après la colonne clé pour spécifier l'utilisation. En effet, vous avez déjà défini la colonne en tant que clé lorsque vous avez créé la structure d'exploration de données.

Les lignes restantes spécifient l'utilisation des colonnes dans le nouveau modèle d'exploration de données. Vous pouvez spécifier l'utilisation d'une colonne du modèle d'exploration de données à des fins de prédiction en utilisant la syntaxe suivante :

<column name> PREDICT,

Si vous ne spécifiez pas d'utilisation, vous n'avez pas besoin d'inclure une colonne de structure d'exploration de données dans la liste. Toutes les colonnes utilisées par la structure d'exploration de données référencée sont automatiquement mises à la disposition des modèles d'exploration de données basés sur cette structure. Toutefois, le modèle n'utilisera pas les colonnes pour la formation à moins que vous ne spécifiiez l'utilisation.

La dernière ligne du code définit l'algorithme et les paramètres d'algorithme employés pour générer le modèle d'exploration de données.

) USING <algorithm>( <algorithm parameters> )

Tâches de la leçon

Au cours de cette leçon, vous allez effectuer les tâches suivantes :

  • ajouter un modèle d'exploration de données Association à la structure à l'aide de la probabilité par défaut ;

  • ajouter un modèle d'exploration de données Association à la structure à l'aide d'une probabilité modifiée.

Ajout d'un modèle d'exploration de données Association à la structure en utilisant le paramètre MINIMUM_PROBABILITY par défaut

La première tâche consiste à ajouter un nouveau modèle d'exploration de données à la structure d'exploration de données Market Basket en se basant sur l'algorithme Microsoft Association et en utilisant la valeur par défaut du paramètre MINIMUM_PROBABILITY.

Pour ajouter un modèle d'exploration de données Association

  1. Dans l'Explorateur d'objets, cliquez avec le bouton droit sur l'instance de Analysis Services, pointez sur Nouvelle requête, puis cliquez sur DMX.

    L'Éditeur de requête s'ouvre et contient une nouvelle requête vide.

    [!REMARQUE]

    Pour créer une requête DMX sur une base de données Analysis Services spécifique, cliquez avec le bouton droit sur la base de données au lieu de l'instance.

  2. Copiez l'exemple générique de l'instruction ALTER MINING STRUCTURE dans la requête vide.

  3. Remplacez le code suivant :

    <mining structure name> 
    

    par :

    [Market Basket]
    
  4. Remplacez le code suivant :

    <mining model name> 
    

    par :

    [Default Association]
    
  5. Remplacez le code suivant :

    [<key column>],
    <mining model columns>,
    <table columns>
    (  [<nested key column>],
       <nested mining model columns> )
    

    par :

    OrderNumber,
        [Products] PREDICT (
            [Model]
        )
    

    Dans ce cas, la table [Products] a été désignée comme colonne prévisible .. Par ailleurs, la colonne [Model] est incluse dans la liste des colonnes de la table imbriquée car il s'agit de la colonne clé de la table imbriquée.

    [!REMARQUE]

    N'oubliez pas qu'une clé imbriquée est différente d'une clé de cas. Une clé de cas est un identificateur unique du cas, alors que la clé imbriquée est un attribut que vous souhaitez modéliser.

  6. Remplacez le code suivant :

    USING <algorithm>( <algorithm parameters> )
    

    par :

    Using Microsoft_Association_Rules
    

    L'instruction obtenue doit se présenter comme suit :

    ALTER MINING STRUCTURE [Market Basket]
    ADD MINING MODEL [Default Association]
    (
        OrderNumber,
        [Products] PREDICT (
            [Model]
        )
    )
    Using Microsoft_Association_Rules
    
  7. Dans le menu Fichier, cliquez sur Enregistrer DMXQuery1.dmx sous.

  8. Dans la boîte de dialogue Enregistrer sous, accédez au dossier approprié et nommez le fichier Default_Association_Model.dmx.

  9. Dans la barre d'outils, cliquez sur le bouton Exécuter.

Ajout d'un modèle d'exploration de données Association à la structure en modifiant le paramètre MINIMUM_PROBABILITY par défaut

La tâche suivante consiste à ajouter un nouveau modèle d'exploration de données à la structure d'exploration de données Market Basket en partant de l'algorithme Microsoft Association, puis en attribuant la valeur par défaut 0,01 au paramètre MINIMUM_PROBABILITY. La modification du paramètre force alors l'algorithme Microsoft Association à créer d'autres règles.

Pour ajouter un modèle d'exploration de données Association

  1. Dans l'Explorateur d'objets, cliquez avec le bouton droit sur l'instance de Analysis Services, pointez sur Nouvelle requête, puis cliquez sur DMX.

    L'Éditeur de requête s'ouvre et contient une nouvelle requête vide.

  2. Copiez l'exemple générique de l'instruction ALTER MINING STRUCTURE dans la requête vide.

  3. Remplacez le code suivant :

    <mining structure name> 
    

    par :

    Market Basket
    
  4. Remplacez le code suivant :

    <mining model name> 
    

    par :

    [Modified Association]
    
  5. Remplacez le code suivant :

    <mining model columns>,
    <table columns>
    (  [<nested key column>],
       <nested mining model columns> )
    

    par :

    OrderNumber,
    [Products] PREDICT (
            [Model]
        )
    

    Dans ce cas, la table [Products] est désignée en tant que colonne prévisible. Par ailleurs, la colonne [MODEL] est incluse dans la liste car il s'agit de la colonne clé dans la table imbriquée.

  6. Remplacez le code suivant :

    USING <algorithm>( <algorithm parameters> )
    

    par :

    USING Microsoft_Association_Rules (Minimum_Probability = 0.1)
    

    L'instruction obtenue doit se présenter comme suit :

    ALTER MINING STRUCTURE [Market Basket]
    ADD MINING MODEL [Modified Assocation]
    (
        OrderNumber,
        [Products] PREDICT (
            [Model]
        )
    )
    USING Microsoft_Association_Rules (Minimum_Probability = 0.1)
    
  7. Dans le menu Fichier, cliquez sur Enregistrer DMXQuery1.dmx sous.

  8. Dans la boîte de dialogue Enregistrer sous, accédez au dossier approprié et nommez le fichier Modified Association_Model.dmx.

  9. Dans la barre d'outils, cliquez sur le bouton Exécuter.

Dans la leçon suivante, vous allez traiter la structure d'exploration de données Market Basket et ses modèles d'exploration de données associés.