Test de la précision à l'aide de graphiques de courbes d'élévation (Didacticiel sur l'exploration de données de base)

Sous l'onglet Graphique d'analyse de précision de l'exploration de données du Concepteur d'exploration de données, vous pouvez calculer le degré de précision des prédictions de chaque modèle et comparer les résultats entre eux. Cette méthode de comparaison correspond à un graphique de courbes d'élévation. En général, la précision prédictive d'un modèle d'exploration de données se mesure par la finesse ou la précision de classification. Pour ce didacticiel, nous utiliserons le graphique de courbes d'élévation uniquement. Pour plus d'informations sur les graphiques de courbes d'élévation et autres graphiques de précision, consultez Outils de création de diagramme de précision de modèle (Analysis Services - Exploration de données).

Au cours de cette rubrique, vous allez effectuer les tâches suivantes :

  • Choix des données d'entrée

  • Sélection des modèles, des colonnes prédictibles et des valeurs

Choix des données d'entrée

La première étape du test de précision de vos modèles d'exploration de données consiste à sélectionner la source de données que vous allez utiliser pour les tests. Vous allez tester le degré de précision des modèles avec vos données de test, puis vous les utiliserez avec des données externes.

Pour sélectionner le jeu de données

  1. Basculez sous l'onglet Graphique d'analyse de précision de l'exploration de données du Concepteur d'exploration de données dans Outils de données SQL Server (SSDT) et sélectionnez l'onglet Sélection d'entrée.

  2. Dans la zone de groupe Sélectionner le jeu de données à utiliser pour le graphique d'analyse de précision, sélectionnez Utiliser des scénarios de test de structure d'exploration de données pour tester vos modèles en utilisant les données de test que vous avez définies lorsque vous avez créé la structure d'exploration de données.

    Pour plus d'informations sur les autres options, consultez Choisir un type de graphique d'analyse de précision et définir des options de graphique.

Sélection des modèles, des colonnes prédictibles et des valeurs

L'étape suivante consiste à sélectionner les modèles à inclure dans le graphique de courbes d'élévation, la colonne prédictible à laquelle comparer les modèles et la valeur à prédire.

[!REMARQUE]

Les colonnes du modèle d'exploration de données répertoriées dans la liste Nom de la colonne prédictible sont limitées à celles dont le type d'utilisation est Predict ou Predict Only et dont le type de contenu est Discrete ou Discretized.

Pour afficher l'efficacité des modèles

  1. Sous l'onglet Sélection d'entrée du Concepteur d'exploration de données, sous Sélectionnez les colonnes prédictibles du modèle d'exploration de données à afficher dans le graphique de courbes d'élévation, activez la case à cocher Synchroniser les colonnes de prédiction et les valeurs.

  2. Dans la colonne Nom de la colonne prédictible, vérifiez que Bike Buyer est sélectionné pour chaque modèle.

  3. Dans la colonne Afficher, sélectionnez chacun des modèles.

    Par défaut, tous les modèles de la structure d'exploration de données sont sélectionnés. Vous pouvez choisir de ne pas inclure un modèle, mais pour ce didacticiel, conservez tous les modèles sélectionnés.

  4. Dans la colonne Prédire la valeur, sélectionnez 1. La même valeur est automatiquement remplie dans chaque modèle comportant la même colonne prédictible.

  5. Sélectionnez l'onglet Graphique de courbes d'élévation pour afficher le graphique de courbes d'élévation.

    Lorsque vous cliquez sur l'onglet, une requête de prédiction s'exécute sur le serveur, dans la base de données pour la structure d'exploration de données et la table d'entrée ou les données de test. Les résultats sont reportés sur le graphique.

    Lorsque vous entrez une valeur dans Prédire la valeur, le graphique de courbes d'élévation trace un modèle d'estimation aléatoire et un modèle idéal. Les modèles d'exploration de données que vous avez créés se trouveront entre ces deux extrêmes, c'est-à-dire entre une estimation aléatoire et une prédiction parfaite. Toute amélioration par rapport à l'estimation aléatoire est considérée comme une finesse.

  6. Utilisez la légende pour repérer les lignes colorées qui représentent le modèle idéal et le modèle d'estimation aléatoire.

    Vous remarquerez que le modèle TM_Decision_Tree fournit la plus grande finesse, devançant ainsi les modèles Clustering et Naive Bayes.

Pour obtenir une explication approfondie d'un graphique de courbes d'élévation semblable à celui créé au cours de cette leçon, consultez Graphique de courbes d'élévation (Analysis Services - Exploration de données).

Tâche suivante de la leçon

Test d'un modèle filtré (Didacticiel sur l'exploration de données de base)

Voir aussi

Référence

Onglet Graphique de courbes d'élévation (vue Graphique d'analyse de précision de l'exploration de données)

Concepts

Graphique de courbes d'élévation (Analysis Services - Exploration de données)