Exploration du modèle de prévision (Didacticiel sur l'exploration de données intermédiaire)

Maintenant que vous avez créé le modèle d'exploration de données de prévision, vous pouvez parcourir les résultats en utilisant l'onglet Visionneuse de modèle d'exploration de données du Concepteur d'exploration de données. La Visionneuse de l'algorithme MTS (Microsoft Time Series) contient deux onglets : Graphiques et Modèle.

Le modèle d'exploration de données de prévision que vous avez créé décrit les ventes de produits dans trois régions différentes : Europe, Amérique du Nord et Pacifique pour les années 2001 à 2004. En conséquence, l'algorithme MTS (Microsoft Time Series) crée un seul modèle de série chronologique qui contient plusieurs arborescences, chacune d'elles contenant une combinaison différente de région, produit et attribut prévisible.

Chacun des onglets inclus dans la visionneuse vous donne une vue différente des informations comprises dans le modèle de série chronologique complet.

  • Onglet Graphiques

  • Onglet Modèle

  • Vue de contenu générique

Onglet Graphiques

L'onglet Graphiques de la Visionneuse de l'algorithme MTS (Microsoft Time Series) vous propose une représentation graphique de chacune des arborescences que l'algorithme crée. Une arborescence de série chronologique contient une combinaison unique de produit, région et attribut prévisible.

La légende figurant à droite de la visionneuse présente les séries chronologiques sélectionnées dans la liste déroulante et contient une case à cocher pour chacune d'elles. Pour afficher ou non des séries dans la visionneuse, sélectionnez ou désactivez les cases à cocher correspondantes dans la légende.

Vous pouvez également modifier les options d'affichage telles que les couleurs utilisées pour chaque série chronologique ou examiner les valeurs de tout point dans le graphique.

Pour sélectionner une série chronologique

  1. Cliquez sur l'onglet Graphiques de l'onglet Visionneuse de modèle d'exploration de données, s'il n'est pas déjà affiché.

  2. Cliquez sur la liste déroulante située à droite du graphique, puis activez toutes les cases à cocher : Le graphique doit contenir 24 lignes de série différentes.

  3. Cliquez sur OK.

  4. Désactivez les cases à cocher situées à droite du graphique pour masquer temporairement les lignes de toutes les séries basées sur Amount.

  5. Maintenant, désactivez les cases à cocher en rapport avec les vélos R750 et R250.

    Le graphique contient à présent uniquement les 6 lignes de série suivantes, afin que vous puissiez plus facilement comparer les tendances des vélos M200 et T1000.

    • M200 Europe: Quantity

    • M200 North America: Quantity

    • M200 Pacific: Quantity

    • T1000 Europe: Quantity t

    • T1000 North America: Quantity

    • T1000 Pacific: Quantity

Prédiction de la quantité des séries M200 et T1000Prédiction de la quantité des séries M200 et T1000

Le graphique affiche à la fois les données historiques et les données prédites. Les données prédites sont ombrées pour les distinguer des données historiques. Pour simplifier la comparaison de séries différentes, vous pouvez également modifier les couleurs associées à chaque ligne dans le graphique. Pour plus d'informations, consultez Procédure : modifier les couleurs utilisées dans la Visionneuse d'exploration de données.

Les lignes de tendance indiquent que le total des ventes enregistré pour toutes les régions est globalement croissant, avec une pointe tous les 12 mois, en décembre. Les prédictions suivent généralement cette tendance. En examinant le graphique, vous pouvez également remarquer que les données pour les vélos T1000 démarrent beaucoup plus tard que celles des séries des autres produits.

Par défaut, Analysis Services présente cinq étapes de prédiction pour chaque série chronologique. Vous pouvez modifier cette valeur pour afficher plus ou moins d'étapes de prédiction. Vous pouvez également afficher graphiquement l'écart type de la prédiction en ajoutant des barres d'erreur au graphique.

Pour modifier les options de prédiction et d'affichage dans la vue Graphique

  1. Modifiez progressivement la valeur Étapes de la prévision de 5 à 10, puis revenez à 6.

    Notez que dans les lignes de tendance comportant de grandes fluctuations dans les données historiques, les fluctuations sont amplifiées pendant la prédiction.

  2. Activez la case à cocher Afficher les écarts.

  3. Placez le curseur de la souris au-dessus des barres d'erreur de la série M200.

  4. Placez le curseur de la souris au-dessus des barres d'erreur de la série T1000 Pacific.

Vous utiliserez ces résultats pour approfondir l'étude. Ensuite, vous développerez un modèle qui correspond à la moyenne de toutes les régions et qui n'est donc pas soumis à autant de fluctuation.

Retour en haut

Onglet Modèle

L'onglet Modèle de la visionneuse de l'algorithme MST (Microsoft Time Series) incluse dans le Concepteur d'exploration de données vous permet d'afficher les séries chronologiques sous la forme de graphique d'arbre de décision. Un arbre distinct est calculé pour chaque série que vous avez incluse dans le modèle. Dans un modèle de série chronologique, le graphique d'arbre de décision peut avoir un nœud unique, si la série chronologique est linéaire, ou il peut avoir plusieurs nœuds et conditions associées à chaque branche, à l'instar d'un arbre de décision standard.

Les nœuds inclus dans le graphique d'arbre de décision pour une série chronologique contiennent différents types d'informations :

  • La concentration de cas pour l'état de l'attribut prévisible spécifié dans le contrôle Arrière-plan. La fenêtre Légende du nœud et l'info-bulle qui s'affichent lorsque vous positionnez le pointeur de la souris au-dessus d'un objet de l'arborescence indiquent le nombre exact de cas.

  • La formule de régression du nœud. La formule de régression ARTXP est uniquement disponible dans les nœuds terminaux. L'équation ARIMA est disponible dans le nœud racine de l'arbre.

  • Un graphique en losange qui représente la plage de l'attribut. Le losange est situé au niveau de la moyenne du nœud et la largeur du losange représente la variance de l'attribut sur ce nœud.

Pour consulter l'arbre de décision d'un modèle de série chronologique

  1. Dans la liste Arborescence accessible depuis l'onglet Modèle de la visionneuse, sélectionnez la série M200 North America:Amount.

    Un nœud unique apparaît dans le graphique.

  2. Placez le curseur de la souris au-dessus du nœud.

    Pour un nœud Tout, l'info-bulle qui apparaît inclut des informations telles que le nombre de cas dans la série entière et des équations de série chronologique dérivées de l'analyse des données.

  3. Cliquez sur le nœud et consultez la Légende d'exploration de données.

    La Légende d'exploration de données inclut des informations semblables à celles contenues dans l'info-bulle, mais elle fournit des détails supplémentaires, notamment un histogramme de valeurs.

  4. Dans la liste Arborescence accessible depuis l'onglet Modèle de la visionneuse, sélectionnez la série M200 Pacific:Amount.

    Le graphique d'arbre contient maintenant un nœud Tout et deux nœuds enfants. Le texte des nœuds enfants décrit les conditions qui ont fractionné l'arbre.

  5. Placez le curseur de la souris au-dessus de l'un des nœuds enfants et examinez le contenu de l'info-bulle. Vous pouvez également cliquer sur le nœud et afficher la Légende d'exploration de données.

    Pour les nœuds enfants, la description inclut le nombre de cas dans chaque branche de l'arbre et toutes les conditions supplémentaires qui ont provoqué le fractionnement de l'arbre.

Retour en haut

Visionneuse d'arborescences de contenu générique

Outre la visionneuse personnalisée pour les séries chronologiques, Analysis Services fournit la Visionneuse de l'arborescence de contenu génériqueMicrosoft. Cette visionneuse peut être utilisée pour tous les modèles d'exploration de données, quel que soit l'algorithme que vous avez utilisé. La Visionneuse d'arborescences de contenu générique est disponible dans la liste déroulante Visionneuse.

Dans cette visionneuse, chaque modèle d'exploration de données, indépendamment des données ou de l'algorithme utilisés pour l'analyse, est représenté sous la forme d'une arborescence qui contient une série de nœuds. Chaque nœud représente la connaissance acquise à propos d'un sous-ensemble des données. Le contenu exact du nœud diffère selon l'algorithme et le type de l'attribut prévisible, mais le schéma général du contenu reste le même.

Étant donné que le modèle d'exploration de données que vous avez créé est un modèle mixte, combinant à la fois des algorithmes ARTXP et ARIMA, Analysis Services utilise chaque algorithme tour à tour pour créer des modèles ARTXP et ARIMA distincts pour chaque série chronologique. Lorsque vous utilisez la visionneuse de l'algorithme MTS (Microsoft Time Series) pour parcourir le modèle d'exploration de données de prévision, Analysis Services combine les résultats des deux algorithmes et affiche le modèle d'exploration de données sous la forme d'une arborescence unique, avec chaque nœud de l'arborescence incluant du contenu provenant des deux algorithmes.

Toutefois, lorsque vous utilisez la Visionneuse de l'arborescence de contenu génériqueMicrosoft, le contenu généré par chaque algorithme est exposé en tant que deux types différents de nœuds dans le modèle d'exploration de données de prévision. Vous pouvez descendre dans la hiérarchie de la version ARTXP ou de la version ARIMA du modèle pour approfondir les niveaux de détail.

Pour consulter des détails pour une série de données particulière dans la visionneuse de contenu générique

  1. Sous l'onglet Visionneuse de modèle d'exploration de données, sélectionnez Visionneuse de l'arborescence de contenu générique Microsoft dans la liste déroulante Visionneuse.

  2. Dans le volet Légende du nœud, cliquez sur le nœud de premier niveau (Tout).

  3. Dans le volet Détails du nœud, recherchez la valeur de ATTRIBUTE_NAME.

    Cette valeur vous indique quelle série, ou combinaison de produit et région, est contenue dans ce nœud. Dans l'exemple AdventureWorks, le nœud de premier niveau correspond à la série M200 Europe.

  4. Dans le volet Légende du nœud, localisez le premier nœud qui possède des nœuds enfants.

    Si un nœud de série possède des enfants, l'arbre affiché sous l'onglet Modèle de la Visionneuse de l'algorithme MTS (Microsoft Time Series) a également une structure de branches.

  5. Développez le nœud et cliquez sur l'un des nœuds enfants.

    La colonne NODE_DESCRIPTION du schéma contient la condition qui a provoqué le fractionnement de l'arborescence.

  6. Dans le volet Légende du nœud, cliquez sur le nœud ARIMA de premier niveau, puis développez le nœud jusqu'à ce que tous les nœuds enfants soient visibles.

  7. Dans le volet Détails du nœud, recherchez la valeur de ATTRIBUTE_NAME.

    Cette valeur vous indique quelle série chronologique est contenue dans ce nœud. Le nœud de premier niveau dans la section ARIMA doit correspondre au nœud de premier niveau dans la section (Tout). Dans l'exemple AdventureWorks, ce nœud contient l'analyse ARIMA de la série M200 Europe.

Pour plus d'informations, consultez Contenu du modèle d'exploration de données pour les modèles de séries chronologiques (Analysis Services - Exploration de données).

Retour en haut