Outils de création de diagramme de précision de modèle (Analysis Services - Exploration de données)
L'onglet Graphique d'analyse de précision de l'exploration de données disponible dans SQL Server Management Studio et Business Intelligence Development Studio fournit plusieurs outils pour la validation des modèles d'exploration de données :
Les graphiques de courbes d'élévation, les graphiques des bénéfices et les nuages de points peuvent tous être affichés sous l'onglet Graphique de courbes d'élévation. Utilisez l'onglet Sélection d'entrée pour choisir un modèle et définir des options, puis cliquez sur l'onglet Graphique de courbes d'élévation et sélectionnez le type de graphique souhaité dans la liste Type de graphique. Un nuage de points s'affiche automatiquement si le modèle représente une régression linéaire.
Les matrices de classification, parfois appelées tables de confusion, peuvent être configurées sous l'onglet Sélection d'entrée, puis affichées sous l'onglet Matrice de classification.
Des rapports de validation croisée peuvent être configurés et affichés sous l'onglet Validation croisée de l'onglet Graphique d'analyse de précision de l'exploration de données.
Notes
L'onglet Graphique d'analyse de précision de l'exploration de données ne peut pas être utilisé avec les modèles de séries chronologiques.
Graphique de courbes d'élévation
Un graphique de courbes d'élévation trace les résultats des requêtes de prédiction d'un jeu de données de test en fonction des valeurs connues de la colonne prévisible figurant dans le jeu de données. Le graphique affiche les résultats du modèle d'exploration de données, ainsi qu'une représentation des résultats qu'un modèle idéal produirait et une représentation des résultats d'une estimation aléatoire. Toute amélioration au-dessus de la ligne aléatoire est appelée finesse. Plus la finesse du modèle est importante, plus le modèle est efficace. Seuls les modèles d'exploration de données qui contiennent des attributs prévisibles discrets peuvent être comparés dans un graphique de courbes d'évaluation.
Vous pouvez créer un graphique de courbes d'élévation en utilisant l'onglet Sélection d'entrée pour configurer le modèle cible et choisir un jeu de données de test. Cliquez ensuite sur l'onglet Graphique de courbes d'élévation pour afficher le graphique terminé.
Pour plus d'informations : Graphique de courbes d'élévation (Analysis Services - Exploration de données), Rubriques Procédure : onglet Graphique d'analyse de précision de l'exploration de données, Outils de création de diagramme de précision de modèle (Analysis Services - Exploration de données)
Graphique des bénéfices
Un graphique des bénéfices est une variante du graphique de courbes d'élévation qui intègre des informations sur le coût commercial de l'utilisation des prédictions générées par un modèle. Une fois que vous avez entré les faits liés aux coûts, par exemple les frais de publipostage, Analysis Services affiche une courbe qui présente la finesse fournie par le modèle, et calcule également le retour sur investissement lorsque le modèle est utilisé.
Vous pouvez créer un graphique des bénéfices en utilisant l'onglet Sélection d'entrée pour configurer le modèle cible et choisir un jeu de données de test. Cliquez ensuite sur l'onglet Graphique de courbes d'élévation et sélectionnez Graphique des bénéfices dans la liste Type de graphique. La boîte de dialogue Paramètres du graphique des bénéfices s'ouvre automatiquement. Une fois que vous avez configuré les paramètres propres aux graphiques des bénéfices, le graphique affiché sous l'onglet Graphique d'analyse de précision de l'exploration de données change automatiquement pour afficher les bénéfices et des pertes par unité.
Pour plus d'informations : Graphique des bénéfices (Analysis Services - Exploration de données), Boîte de dialogue Paramètres du graphique des bénéfices (vue Graphique d'analyse de précision de l'exploration de données)
Nuage de points
Un nuage de points représente la précision d'un modèle qui prédit un attribut continu, en comparant les valeurs réelles aux valeurs prédites pour chaque cas. Un nuage de points est généré à la place d'un graphique de courbes d'élévation lorsque les attributs prévisibles ont des valeurs continues.
Si votre modèle prend en charge la colonne prévisible et les colonnes d'entrée requises, vous pouvez créer un nuage de points sous l'onglet Graphique d'analyse de précision de l'exploration de données du Concepteur d'exploration de données. Vous devez tout d'abord utiliser l'onglet Sélection d'entrée pour configurer le modèle cible et choisir un jeu de données de test. Cliquez ensuite sur l'onglet Graphique de courbes d'élévation. Le graphique affiché sous l'onglet Graphique d'analyse de précision de l'exploration de données change automatiquement pour afficher un graphique qui présente la relation linéaire entre les entrées et les valeurs prédites.
Pour plus d'informations : Nuage de points (Analysis Services - Exploration de données)
Matrice de classification
Une matrice de classification est un autre moyen d'évaluer la précision des prédictions créées par les modèles d'exploration de données d'une structure. Pour générer une matrice de classification, Analysis Services comptabilise le nombre de prédictions correctes et incorrectes, à l'aide des valeurs réelles se trouvant dans le jeu de données de test. La matrice est un outil très utile étant donné qu'elle montre non seulement combien de fois le modèle a correctement prédit une valeur, mais qu'elle identifie aussi les valeurs que le modèle a prédites de façon incorrecte. Une matrice de classification indique le nombre réel de vrais positifs, faux positifs, vrais négatifs et faux négatifs pour chaque attribut prévisible.
Vous pouvez créer une matrice de classification sous l'onglet Graphique d'analyse de précision de l'exploration de données du Concepteur d'exploration de données. Utilisez tout d'abord l'onglet Sélection d'entrée pour configurer le modèle cible et choisir un jeu de données de test. Cliquez ensuite sur l'onglet Matrice de classification. Le graphique s'affiche automatiquement, sans qu'aucune autre configuration ne soit requise.
Pour plus d'informations :Matrice de classification (Analysis Services - Exploration de données), Rubriques Procédure : onglet Graphique d'analyse de précision de l'exploration de données, Outils de création de diagramme de précision de modèle (Analysis Services - Exploration de données)
Rapport de validation croisée
La validation croisée est une technique d'exploration de données avancée qui vous permet de mesurer la validité de votre modèle. Lorsque vous créez un rapport de validation croisée, Analysis Services divise votre jeu de données en plusieurs sections croisées, crée automatiquement plusieurs modèles sur les sous-ensembles et en effectue l'apprentissage, puis calcule la précision de tous les modèles. En examinant les statistiques qui sont générées, vous pouvez évaluer le degré de généralisation d'un modèle sur différents jeux de données ou déterminer quel modèle d'une structure, parmi plusieurs modèles, permet d'obtenir les meilleurs résultats.
Vous pouvez créer un rapport de validation croisée sous l'onglet Graphique d'analyse de précision de l'exploration de données du Concepteur d'exploration de données en sélectionnant un modèle ou une structure, puis en utilisant l'onglet Validation croisée pour définir les options relatives au nombre de plis, à l'attribut cible, etc.
Pour plus d'informations : Validation croisée (Analysis Services - Exploration de données), Rapport de validation croisée (Analysis Services - Exploration de données)