Procédure : créer un rapport de validation croisée

Pour créer un rapport de validation croisée dans SQL ServerAnalysis Services, vous devez compléter des étapes qui sont légèrement différentes des procédures destinées à d'autres types de graphiques d'analyse de précision. Cela tient au fait qu'un rapport de validation croisée n'utilise pas de données externes, mais utilise à la place uniquement les données d'origine utilisées pour l'apprentissage du modèle. Par conséquent, vous n'êtes pas obligé de sélectionner une source de données ou de mapper des colonnes dans la source de données aux colonnes du modèle d'exploration de données.

La procédure suivante décrit les étapes pour configurer et générer un rapport de validation croisée. Pour obtenir des informations d'ordre général sur la validation croisée, consultez Validation croisée (Analysis Services - Exploration de données).

Pour des informations sur la création d'autres types de graphique d'analyse de précision, consultez Procédure : créer un graphique d'analyse de précision pour un modèle d'exploration de données.

[!REMARQUE]

Seuls les modèles ayant un rapport avec la structure actuellement sélectionnée sont disponibles pour la validation croisée. Si la structure prend en charge des modèles qui ont des attributs prévisibles différents, ou si la structure prend en charge une combinaison de modèles de clustering et des modèles de non-clustering, vous devez créer des rapports séparés pour chaque sortie prévisible ou créer des rapports séparés pour les modèles de clustering et de non-clustering.

Pour sélectionner une structure d'exploration de données pour la validation croisée

  1. Ouvrez le Concepteur d'exploration de données dans Business Intelligence Development Studio.

  2. Dans l'Explorateur de solutions, ouvrez la base de données qui contient la structure ou le modèle auquel est destiné le rapport que vous créez.

  3. Double-cliquez sur la structure d'exploration de données pour ouvrir la structure et ses modèles associés dans le Concepteur d'exploration de données.

  4. Cliquez sur l'onglet Graphique d'analyse de précision de l'exploration de données.

  5. Cliquez sur l'onglet Validation croisée.

Pour définir les options de validation croisée

  1. Sous l'onglet Validation croisée, pour Nombre de replis, cliquez sur la flèche vers le bas pour sélectionner un nombre entre 1 et 10. La valeur par défaut est 10.

    Le Nombre de replis représente le nombre des partitions qui seront créées dans le jeu de données d'origine. Si vous définissez le Nombre de replis à 1, le jeu d'apprentissage est utilisé sans partitionnement.

  2. Pour Attribut cible, cliquez sur la flèche vers le bas et sélectionnez une colonne dans la liste. Si le modèle est un modèle de clustering, sélectionnez #Cluster pour indiquer que le modèle n'a pas d'attribut prévisible.

    Vous ne pouvez sélectionner qu'un seul attribut prévisible par rapport. Par défaut, tous les modèles connexes qui ont le même attribut prévisible sont inclus dans le rapport.

  3. Pour Nombre maximal de cas, entrez un nombre qui est assez grand pour fournir un exemple représentatif de données lorsque les données sont fractionnées parmi le nombre spécifié de plis. Si le nombre est supérieur au nombre de cas dans le jeu d'apprentissage du modèle, tous les cas sont utilisés.

    Si le jeu de données d'apprentissage est très important, la définition de la valeur de Nombre maximal de cas limite le nombre total de cas traités, et permet au rapport de se terminer plus vite. Toutefois, vous ne devez pas définir une valeur trop basse pour Nombre maximal de cas au risque de manquer de données suffisantes pour la validation croisée.

  4. Éventuellement, pour État cible, tapez la valeur de l'attribut prévisible que vous souhaitez modeler. Par exemple, si la colonne Bike Buyer a deux valeurs possibles, 1 (Oui) et 2 (Non), vous pouvez entrer la valeur 1 pour évaluer la précision du modèle pour les acheteurs de bicyclette.

    [!REMARQUE]

    Si vous n'entrez pas de valeur, l'option Seuil cible n'est pas disponible, et le modèle est évalué pour toutes les valeurs possibles de l'attribut prévisible.

  5. Éventuellement, pour Seuil cible, tapez un nombre décimal entre 0 et 1 pour spécifier la probabilité minimale nécessaire à une prédiction pour être comptabilisé comme exacte.

    Pour plus d'informations sur la définition des seuils de probabilité, consultez Rapport de validation croisée (Analysis Services - Exploration de données).

  6. Cliquez sur Obtenir les résultats.

Pour imprimer le rapport

  1. Cliquez avec le bouton droit sur le rapport complété sous l'onglet Validation croisée .

  2. Dans le menu contextuel, cliquez sur Imprimer ou Aperçu avant impression pour afficher d'abord un aperçu du rapport.

Pour créer une copie du rapport dans Microsoft Excel

  1. Cliquez avec le bouton droit sur le rapport complété sous l'onglet Validation croisée .

  2. Dans le menu contextuel, cliquez sur Sélectionner tout.

  3. Cliquez avec le bouton droit sur le texte sélectionné, puis sélectionnez Copier.

  4. Collez la sélection dans un classeur Excel ouvert. Si vous utilisez l'option Coller, le rapport est collé dans Excel au format HTML, ce qui conserve la mise en forme des lignes et des colonnes. Si vous collez le rapport en utilisant les options Collage spécial pour le texte ou le texte Unicode, le rapport est collé au format séparé par des lignes.