Confronto delle stime per i modelli di previsione (Esercitazione intermedia sul data mining)

Sono stati creati i tre modelli seguenti:

  • Stime per ogni combinazione di area e modello, basate solo sui dati per il singolo modello e l'area.

  • Stime per tutti i modelli su scala mondiale, basate sui dati aggregati.

  • Stime per il modello M200 nell'area dell'America del nord, basate sul modello aggregato.

In questa attività finale si confronteranno le stime per ogni modello al fine di stabilire in che modo l'utilizzo del modello generalizzato influisce sui risultati.

Confronto dei risultati delle stime

Si tenga presente che il modello di data mining originale mostrava un ampio gap tra determinate aree e linee del modello. La linea di tendenza per il modello M200 era particolarmente elevata, mentre le linee di tendenza per il modello T1000 erano basse e relativamente piatte.

Serie per la stima delle quantità M200 e T1000Serie per la stima delle quantità M200 e T1000

È possibile creare un grafico che include tutte le stime esportando i risultati e i dati originali in Microsoft Excel, che fornisce strumenti più sofisticati per la creazione di grafici e la gestione di più serie di dati. Nel diagramma seguente sono illustrate le linee di tendenza solo per i modelli relativi al prodotto M200, confrontando le stime dal primo modello di data mining con le stime basate sul modello di data mining aggregato.

Grafico di Excel che confronta stimeGrafico di Excel che confronta stime

Da questo grafico è possibile osservare che il modello di data mining aggregato rende uniformi le fluttuazioni nella singola serie di dati. Nella tabella seguente viene riportata una parte della serie di dati utilizzata per creare il grafico, in modo da agevolare il confronto.

Serie e modello di data mining

25/7/2004

25/8/2004

25/9/2004

25/10/2004

25/11/2004

M200 Europe — aggregato

143

126

115

119

94

M200 Europe — specifico

121

142

152

149

154

M200 North America — aggregato

208

150

149

151

172

M200 North America — specifico

163

178

156

173

203

M200 Pacific — aggregato

89

80

71

77

57

M200 Pacific — specifico

46

44

42

42

38

T1000 Europe — aggregato

65

51

54

53

48

T1000 Europe — specifico

42

41

43

42

43

T1000 North America — aggregato

103

84

79

85

68

T1000 North America — specifico

82

78

78

83

83

T1000 Pacific — aggregato

68

52

48

56

44

T1000 Pacific — specifico

38

39

37

38

36

Conclusione

È stato descritto come creare un modello Time Series che può essere utilizzato per la stima e un modello generalizzato che può essere applicato a una diversa serie di dati.