PredictTimeSeries (DMX)

Article
05/07/2013

Retourne les valeurs suivantes prédites pour les données de série chronologique. Les données de séries chronologiques étant continues, elles peuvent être stockées dans une table imbriquée ou une table de cas. La fonction PredictTimeSeries retourne toujours une table imbriquée.

Syntaxe

PredictTimeSeries(<table column reference>)
PredictTimeSeries(<table column reference>, n)
PredictTimeSeries(<table column reference>, n-start, n-end)
PredictTimeSeries(<scalar column reference>)
PredictTimeSeries(<scalar column reference>, n)
PredictTimeSeries(<scalar column reference>, n-start, n-end)
PredictTimeSeries(<table column reference>, n, REPLACE_MODEL_CASES | EXTEND_MODEL_CASES) PREDICTION JOIN <source query>
PredictTimeSeries(<table column reference>, n-start, n-end, REPLACE_MODEL_CASES | EXTEND_MODEL_CASES) PREDICTION JOIN <source query>
PredictTimeSeries(<scalar column reference>, n, REPLACE_MODEL_CASES | EXTEND_MODEL_CASES) PREDICTION JOIN <source query>
PredictTimeSeries(<scalar column reference>, n-start, n-end, REPLACE_MODEL_CASES | EXTEND_MODEL_CASES) PREDICTION JOIN <source query>

Arguments

<table column reference>, <scalar column referenc>
Spécifie le nom de la colonne à prédire. La colonne peut contenir des données scalaires ou tabulaires.
n
Spécifie le nombre d'étapes suivantes à prédire. Si aucune valeur n'est spécifiée pour n, la valeur par défaut est 1.

n ne peut pas être 0. La fonction retourne une erreur si vous ne faites pas au moins une prédiction.
n-start, n-end
Spécifie une plage d'étapes de série chronologique.

n-start doit être un entier différent de 0.

n-end doit être un entier supérieur à n-start.
<source query>
Définit les données externes qui sont utilisées pour faire des prédictions.
REPLACE_MODEL_CASES | EXTEND_MODEL_CASES
Indique comment gérer de nouvelles données.

REPLACE_MODEL_CASES spécifie que les points de données dans le modèle doivent être remplacés par les nouvelles données. Toutefois, les prédictions sont basées sur les modèles dans le modèle d'exploration de données existant.

EXTEND_MODEL_CASES spécifie que les nouvelles données doivent être ajoutées au jeu de données d'apprentissage d'origine. Les futures prédictions sont élaborées uniquement sur le jeu de données composite après que les nouvelles données ont été utilisées.

Ces arguments peuvent être uniquement utilisés lorsque les nouvelles données sont ajoutées à l'aide d'une instruction PREDICTION JOIN. Si vous utilisez une requête PREDICTION JOIN et que vous ne spécifiez pas d'argument, la valeur par défaut est EXTEND_MODEL_CASES.

Type de valeur renvoyé

<table expression>.

Notes

L'algorithme MTS (Microsoft Time Series) ne prend pas en charge la prédiction historique lorsque vous utilisez l'instruction PREDICTION JOIN pour ajouter de nouvelles données.

Dans une instruction PREDICTION JOIN, le processus de prédiction commence toujours à l'étape venant immédiatement après la fin de la série d'apprentissage d'origine. Cela est vrai même si vous ajoutez de nouvelles données. Par conséquent, le paramètre n et les valeurs de paramètre n-start doivent être des entiers supérieurs à 0.

[!REMARQUE]

La longueur des nouvelles données n'affecte pas le point de départ de la prédiction. Par conséquent, si vous souhaitez ajouter de nouvelles données et faire de nouvelles prédictions, assurez-vous soit d'attribuer au point de départ de prédiction une valeur supérieure à la longueur des nouvelles données, soit d'étendre le point de fin de prédiction de la durée des nouvelles données.

Exemple

Les exemples suivants montrent comment faire des prédictions sur un modèle de série chronologique existant :

Le premier exemple montre comment faire un nombre spécifié de prédictions basées sur le modèle actif.
Le deuxième exemple indique comment utiliser le paramètre REPLACE_MODEL_CASES pour appliquer les modèles dans le modèle spécifié à un nouveau jeu de données.
Le troisième exemple indique comment utiliser le paramètre EXTEND_MODEL_CASES pour mettre à jour un modèle d'exploration de données avec de nouvelles données.

Pour en savoir plus sur l'utilisation des modèles de série chronologique, consultez le didacticiel d'exploration de données, Leçon 2 : génération d'un scénario de prévision (Didacticiel intermédiaire sur l'exploration de données) et Didacticiel DMX sur la prédiction de série chronologique.

[!REMARQUE]

Vous pouvez obtenir des résultats différents de votre modèle ; les résultats des exemples suivants sont fournis uniquement pour illustrer le format de résultat.

Exemple 1 : Prédiction de plusieurs tranches de temps

L'exemple suivant utilise la fonction PredictTimeSeries pour retourner une prédiction des trois prochaines étapes de la série M200 dans les régions Europe et Pacifique et en limiter les résultats. Dans ce modèle spécifique, l'attribut prédictible est Quantity ; vous devez donc utiliser [Quantity] comme premier argument de la fonction PredictTimeSeries.

SELECT FLATTENED
    [Forecasting].[Model Region],
    PredictTimeSeries([Forecasting].[Quantity],3)AS t 
FROM
    [Forecasting]
WHERE [Model Region] = 'M200 Europe'
OR [Model Region] = 'M200 Pacific'

Résultats attendus :

Model Region	t.$TIME	t.Quantity
M200 Europe	25/07/2008 12:00:00	121
M200 Europe	25/08/2008 12:00:00	142
M200 Europe	25/09/2008 12:00:00	152
M200 Pacific	25/07/2008 12:00:00	46
M200 Pacific	25/08/2008 12:00:00	44
M200 Pacific	25/09/2008 12:00:00	42

Dans cet exemple, le mot clé FLATTENED a été utilisé pour simplifier la lecture des résultats. Si vous n'utilisez pas le mot clé FLATTENED et qu'à la place vous retournez un ensemble de lignes hiérarchique, cette requête retourne deux colonnes. La première contient la valeur de [ModelRegion] et la deuxième une table imbriquée à deux colonnes : $TIME, qui affiche les tranches horaires prédites, et Quantity, qui contient les valeurs prédites.

Exemple 2 : ajout de nouvelles données et utilisation de REPLACE_MODEL_CASES

Supposez que vous constatez que les données étaient incorrectes pour une région particulière et que vous souhaitez utiliser les modèles dans le modèle, tout en ajustant les prédictions pour qu'elles correspondent aux nouvelles données. Ou il se peut que vous constatiez qu'une autre région a des tendances plus fiables et que vous souhaitiez appliquer le modèle le plus fiable aux données d'une région différente.

Dans de tels scénarios, vous pouvez utiliser le paramètre REPLACE_MODEL_CASES et spécifier un nouveau jeu de données à utiliser comme données d'historique. De cette façon, les projections seront basées sur les modèles dans le modèle spécifié, mais continueront de manière fluide à partir de la fin des nouveaux points de données. Pour une procédure pas à pas complète de ce scénario, consultez Prédictions de série chronologique avancées (Didacticiel intermédiaire sur l'exploration de données).

La requête PREDICTION JOIN suivante illustre la syntaxe pour remplacer des données et élaborer de nouvelles prédictions. Pour les données de remplacement, l'exemple récupère la valeur des colonnes Amount et Quantity et multiplie chacune par deux :

SELECT [Forecasting].[Model Region],
    PredictTimeSeries([Forecasting].[Quantity], 3, REPLACE_MODEL_CASES) 
FROM
    [Forecasting]
PREDICTION JOIN
  OPENQUERY([Adventure Works DW Multidimensional 2012],
    'SELECT [ModelRegion], 
    ([Quantity] * 2) as Quantity,
    ([Amount] * 2) as Amount,
      [ReportingDate]
    FROM [dbo].vTimeSeries
    WHERE ModelRegion = N''M200 Pacific''
    ') AS t
ON
  [Forecasting].[Model Region] = t.[ Model Region] AND
[Forecasting].[Reporting Date] = t.[ReportingDate] AND
[Forecasting].[Quantity] = t.[Quantity] AND
[Forecasting].[Amount] = t.[Amount]

Le tableau suivant compare les résultats de prédiction.

M200 Pacific	25/07/2008 12:00:00	46
M200 Pacific	25/08/2008 12:00:00	44
M200 Pacific	25/09/2008 12:00:00	42

M200 Pacific	25/07/2008 12:00:00	91
M200 Pacific	25/08/2008 12:00:00	89
M200 Pacific	25/09/2008 12:00:00	84

Exemple 3 : ajout de nouvelles données et utilisation d'EXTEND_MODEL_CASES

L'exemple 3 illustre l'utilisation de l'option EXTEND_MODEL_CASES pour fournir de nouvelles données, ajoutées à la fin d'une série de données existante. Plutôt que de remplacer les points de données existants, les nouvelles données sont ajoutées au modèle.

Dans l'exemple suivant, les nouvelles données sont fournies dans l'instruction SELECT qui suit NATURAL PREDICTION JOIN. Vous pouvez fournir plusieurs lignes de nouvelle entrée avec cette syntaxe, mais chaque nouvelle ligne d'entrée doit avoir un horodatage unique :

SELECT [Model Region],
    PredictTimeSeries([Forecasting].[Quantity], 5, EXTEND_MODEL_CASES) 
FROM
    [Forecasting]
NATURAL PREDICTION JOIN
    (SELECT
        1 as [Reporting Date],
        10 as [Quantity],
        'M200 Europe' AS [Model Region]
    UNION SELECT 
        2 as [Reporting Date],
        15 as [Quantity],
        'M200 Europe' AS [Model Region]
) AS T
WHERE ([Model Region] = 'M200 Europe'
 OR [Model Region] = 'M200 Pacific')

La requête utilisant l'option EXTEND_MODEL_CASES, Analysis Services entreprend les actions suivantes pour faire ses prédictions :

Augmente la taille totale des cas d'apprentissage en ajoutant les deux nouveaux mois de données au modèle.
Démarre les prédictions à la fin des données de cas précédentes. Par conséquent, les deux premières prédictions représentent les nouveaux chiffres de ventes réels que vous venez d'ajouter au modèle.
Retourne de nouvelles prédictions pour les trois tranches de temps restantes selon le modèle nouvellement développé.

Le tableau suivant répertorie les résultats de la requête de l'exemple 2. Remarquez que les deux premières valeurs retournées pour M200 Europe sont exactement les mêmes que les nouvelles valeurs que vous avez fournies. Ce comportement est inhérent à la conception ; si vous souhaitez démarrer des prédictions après la fin des nouvelles données, vous devez spécifier des étapes de début et de fin. Pour obtenir un exemple de cette procédure, consultez Leçon 5 : Extension du modèle de série chronologique.

Notez également que vous n'avez pas fourni de nouvelles données pour la région Pacifique. Par conséquent, Analysis Services retourne de nouvelles prédictions pour les cinq tranches de temps.

M200 Europe

$TIME	Quantité
7/25/2008 0:00	10
8/25/2008 0:00	15
9/25/2008 0:00	72
10/25/2008 0:00	69
11/25/2008 0:00	68

M200 Pacific

$TIME	Quantité
7/25/2008 0:00	46
8/25/2008 0:00	44
9/25/2008 0:00	42
10/25/2008 0:00	42
11/25/2008 0:00	38

Exemple 4 : retour de statistiques dans une prédiction de série chronologique

La fonction PredictTimeSeries n'accepte pas INCLUDE_STATISTICS en tant que paramètre. Toutefois, la requête suivante peut être utilisée pour retourner les statistiques de prédiction pour une requête de série chronologique. Cette approche peut également être suivie avec des modèles qui ont des colonnes de tables imbriquées.

Dans ce modèle spécifique, l'attribut prédictible est Quantity ; vous devez donc utiliser [Quantity] comme premier argument de la fonction PredictTimeSeries. Si votre modèle utilise un autre attribut prédictible, vous pouvez substituer un nom de colonne différent.

SELECT FLATTENED [Model Region],
(SELECT 
     $Time,
     [Quantity] as [PREDICTION], 
     PredictVariance([Quantity]) AS [VARIANCE],
     PredictStdev([Quantity]) AS [STDEV]
FROM
      PredictTimeSeries([Quantity], 3) AS t
) AS t
FROM Forecasting
WHERE [Model Region] = 'M200 Europe'
OR [Model Region] = 'M200 North America'

Exemples de résultats :

Model Region	t.$TIME	t.PREDICTION	t.VARIANCE	t.STDEV
M200 Europe	25/07/2008 12:00:00	121	11.6050581415597	3.40661975300439
M200 Europe	25/08/2008 12:00:00	142	10.678201866621	3.26775180615374
M200 Europe	25/09/2008 12:00:00	152	9.86897842568614	3.14149302493037
M200 North America	25/07/2008 12:00:00	163	1.20434529288162	1.20434529288162
M200 North America	25/08/2008 12:00:00	178	1.65031343900634	1.65031343900634
M200 North America	25/09/2008 12:00:00	156	1.68969399185442	1.68969399185442

[!REMARQUE]

Le mot clé FLATTENED a été utilisé dans cet exemple pour simplifier la présentation des résultats dans une table ; toutefois, si votre fournisseur prend en charge les ensembles de lignes hiérarchiques, vous pouvez omettre ce mot clé. Si vous omettez le mot clé FLATTENED, la requête retourne deux colonnes, la première contenant la valeur qui identifie la série de données [Model Region] et la deuxième contenant la table imbriquée de statistiques.

Voir aussi

Référence

Fonctions DMX (Data Mining Extensions)

Predict (DMX)

Concepts

Exemples de requêtes de modèle de série chronologique

Partager via