Création de prédictions (Didacticiel sur l'exploration de données de base)

Une fois que vous avez testé la précision de vos modèles d'exploration de données et décidé qu'ils sont satisfaisants, vous pouvez créer des requêtes de prédiction en utilisant le Générateur de requêtes de prédiction à partir de l'onglet Prédiction de modèle d'exploration de données dans le Concepteur d'exploration de données. Cette interface vous aide à générer des requêtes dans DMX, ou dans le langage DMX (Data Mining Extensions). DMX a une syntaxe similaire à celle de T-SQL mais est utilisée pour des requêtes sur des objets d'exploration de données.

Le Générateur de requêtes de prédiction a trois vues. Avec les vues Conception et Requête, vous pouvez créer votre requête et l'étudier. Vous pouvez ensuite exécuter la requête et afficher les résultats dans la vue Résultat.

Pour plus d'informations sur l'utilisation du Générateur de requêtes de prédiction, consultez Interface de requête d'exploration de données.

Création de la requête

La première étape dans la création d'une requête de prédiction consiste à sélectionner un modèle d'exploration de données et une table d'entrée.

Pour sélectionner un modèle et une table d'entrée

  1. Sous l'onglet Prévision de modèle d'exploration de données du Concepteur d'exploration de données, dans la zone Modèle d'exploration de données, cliquez sur Sélectionner un modèle.

  2. Dans la boîte de dialogue Sélectionner un modèle d'exploration de données, parcourez l'arborescence jusqu'à la structure Publipostage ciblé, développez la structure, sélectionnez TM_Decision_Tree, puis cliquez sur OK.

  3. Dans la zone Sélectionner une ou plusieurs tables d'entrée, cliquez sur Sélectionner la table de cas.

  4. Dans la boîte de dialogue Sélectionner une table, dans la liste Source de données, sélectionnez Adventure Works DW Multidimensional 2012 .

  5. Dans Nom de la table/vue, sélectionnez la table ProspectiveBuyer (dbo), puis cliquez sur OK.

    La table ProspectiveBuyer ressemble étroitement à la table de cas vTargetMail.

Mappage des colonnes

Une fois la table d'entrée sélectionnée, le Générateur de requêtes de prédiction crée un mappage par défaut entre le modèle d'exploration de données et la table d'entrée sur la base des noms des colonnes. Au moins une colonne de la structure doit correspondre à une colonne dans les données externes.

Important

Les données que vous utilisez pour déterminer la précision des modèles doivent contenir une colonne qui peut être mappée à la colonne prédictible. Si une telle colonne n'existe pas, vous pouvez en créer une avec des valeurs vides, mais elle doit avoir le même type de données que la colonne prédictible.

Pour mapper les colonnes de structure aux colonnes de la table d'entrée

  1. Cliquez avec le bouton droit sur les lignes qui connectent la fenêtre Modèle d'exploration de données à la fenêtre Sélectionner une ou plusieurs tables d'entrée et sélectionnez Modifier les connexions.

    Vous remarquez que toutes les colonnes ne sont pas mappées. Nous allons ajouter des mappages pour plusieurs Colonnes de la table. Nous allons également générer une nouvelle colonne de date de naissance sur la colonne de date actuelle, afin que les colonnes correspondent mieux.

  2. Sous Colonne de table, cliquez sur la cellule Bike Buyer et sélectionnez ProspectiveBuyer.Unknown dans la liste déroulante.

    Cette action mappe la colonne prédictible, [Bike Buyer], à une colonne de la table d'entrée.

  3. Cliquez sur OK.

  4. Dans l'Explorateur de solutions, cliquez avec le bouton droit sur la vue de source de données Publipostage ciblé et sélectionnez Concepteur de vues.

  5. Cliquez avec le bouton droit sur la table ProspectiveBuyer et sélectionnez Nouveau calcul nommé.

  6. Dans la boîte de dialogue Créer un calcul nommé, pour Nom de colonne, tapez calcAge.

  7. Pour Description, tapez Calculer l'âge en fonction de la date de naissance.

  8. Dans la zone Expression, tapez DATEDIFF(YYYY,[BirthDate],getdate()), puis cliquez sur OK.

    Comme la table d'entrée n'a aucune colonne Age correspondant à celle du mode, vous pouvez utiliser cette expression pour calculer l'âge des clients à partir de la colonne BirthDate dans la table d'entrée. Comme Age a été identifiée comme la colonne la plus influente pour prédire l'achat d'un vélo, elle doit figurer à la fois dans la table d'entrée et dans le modèle.

  9. Dans le Concepteur d'exploration de données, sélectionnez l'onglet Prédiction de modèle d'exploration de données et rouvrez la fenêtre Modifier les connexions.

  10. Sous Colonne de table, cliquez sur la cellule Age et sélectionnez ProspectiveBuyer.calcAge dans la liste déroulante.

    AttentionAttention

    Si vous ne voyez pas la colonne dans la liste, vous devrez peut-être actualiser la définition de la vue de source de données chargée dans le concepteur. Pour cela, dans le menu Fichier, sélectionnez Enregistrer tout, puis fermez et rouvrez le projet dans le concepteur.

  11. Cliquez sur OK.

Conception de la requête de prédiction

Pour concevoir la requête de prédiction

  1. Le premier bouton dans la barre d'outils de l'onglet Prévision de modèle d'exploration de données est le bouton Basculer en mode Conception / Basculer vers l'affichage du résultat de la requête / Basculer vers l'affichage de la requête. Cliquez sur la flèche vers le bas sur ce bouton et sélectionnez Conception.

  2. Dans la grille située dans l'onglet Prévision de modèle d'exploration de données, cliquez dans la cellule de la première ligne vide dans la colonne Source, puis sélectionnez Fonction de prédiction.

  3. Dans la ligne Fonction de prédiction et dans la colonne Champ, sélectionnez PredictProbability.

    Dans la colonne Alias de la même ligne, tapez Probabilité des résultats.

  4. Dans la fenêtre Modèle d'exploration de données ci-dessus, sélectionnez et faites glisser [Bike Buyer] dans la cellule Critères/Argument.

    Lorsque vous relâchez la souris, [TM_Decision_Tree].[Bike Buyer] s'affiche dans la cellule Critères/Argument.

    Ceci permet de spécifier la colonne cible pour la fonction PredictProbability. Pour plus d'informations sur ces fonctions, consultez Fonctions DMX (Data Mining Extensions).

  5. Cliquez dans la ligne vide suivante de la colonne Source, puis sélectionnez TM_Decision_Tree mining model**.**

  6. Dans la ligne TM_Decision_Tree et la colonne Champ, sélectionnez Bike Buyer.

  7. Dans la ligne TM_Decision_Tree, dans la colonne Critères/Argument, tapez =1.

  8. Cliquez dans la ligne vide suivante de la colonne Source, puis sélectionnez la table ProspectiveBuyer.

  9. Dans la ligne ProspectiveBuyer et la colonne Champ, sélectionnez ProspectiveBuyerKey.

    Un identificateur unique est ainsi ajouté à la requête de prédiction, lequel vous permet d'identifier les personnes susceptibles ou non d'acheter un vélo.

  10. Ajoutez cinq lignes en plus à la grille. Pour chaque ligne, sélectionnez la table ProspectiveBuyer comme la Source puis ajoutez les colonnes suivantes dans les cellules Champ :

    • calcAge

    • LastName

    • FirstName

    • AddressLine1

    • AddressLine2

Enfin, exécutez la requête et consultez les résultats.

Pour exécuter la requête et afficher les résultats

  1. Sous l'onglet Prévision de modèle d'exploration de données, sélectionnez le bouton Résultat.

  2. Après l'exécution de la requête et l'affichage des résultats, vous pouvez examiner les résultats.

    L'onglet Prévision de modèle d'exploration de données affiche des informations de contact pour les clients potentiels susceptibles d'acheter des vélos. La colonne Probabilité des résultats indique le degré d'exactitude de la prédiction. Ces résultats peuvent vous aider à déterminer les clients potentiels à cibler pour le publipostage.

  3. À ce stade, vous pouvez enregistrer les résultats. Vous avez le choix entre trois options.

    • Cliquez avec le bouton droit sur une ligne de données dans les résultats et sélectionnez Copier pour enregistrer uniquement cette valeur (et l'en-tête de colonne) dans le Presse-papiers.

    • Cliquez avec le bouton sur une ligne quelconque dans les résultats et sélectionnez Copier tout pour copier l'intégralité du jeu de résultats, y compris l'en-tête de colonne, dans le Presse-papiers.

    • Cliquez sur Enregistrer le résultat de la requête pour enregistrer les résultats directement dans une base de données comme suit :

      1. Dans la boîte de dialogue Enregistrer le résultat de la requête d'exploration de données, sélectionnez une source de données ou définissez une nouvelle source de données.

      2. Tapez le nom de la table dans laquelle seront enregistrés les résultats de la requête.

      3. Utilisez l'option Ajouter à la vue de source de données, pour créer la table et l'ajouter à une vue de source de données existante. Cela est utile si vous voulez conserver toutes les tables associées pour un modèle, telles que les données de formation, les données source de prédiction et les résultats de la requête, dans la même vue de source de données.

      4. Utilisez l'option Remplacer en cas d'existence, pour mettre à jour une table existante avec les résultats les plus récents.

        Vous devez utiliser l'option permettant de remplacer la table si vous avez ajouté des colonnes à la requête de prédiction, modifié les noms des types de données des colonnes dans la requête de prédiction ou si vous avez exécuté des instructions ALTER sur la table de destination.

        En outre, si plusieurs colonnes portent le même nom (par exemple, le nom de colonne par défaut Expression), vous devez créer un alias pour les colonnes avec des noms en double, sinon une erreur sera générée lorsque le concepteur tentera d'enregistrer les résultats dans SQL Server. En effet, SQL Server n'autorise pas plusieurs colonnes à porter le même nom.

        Pour plus d'informations, consultez Boîte de dialogue Enregistrer le résultat de la requête d'exploration de données (vue Prévision de modèle d'exploration de données).

Tâche suivante de la leçon

Utilisation de l'extraction sur les données de structure (Didacticiel sur l'exploration de données de base)

Voir aussi

Tâches

Créer une requête de prédiction à l'aide du Générateur de requêtes de prédiction

Autres ressources

Utilisation du Générateur de requêtes de prédictions pour créer des requêtes de prédictions DMX