Distribuzioni (DMX)

In MicrosoftSQL ServerAnalysis Services è possibile definire il contenuto delle colonne di una struttura di data mining per determinare la modalità con cui gli algoritmi elaborano i dati di tali colonne durante la creazione dei modelli di data mining. Per alcuni algoritmi è utile definire la distribuzione dei dati nelle colonne continue prima di elaborare il modello, se è noto che tali colonne contengono valori con distribuzioni comuni. Se non si definiscono le distribuzioni, i modelli di data mining risultanti possono produrre stime meno accurate, perché gli algoritmi dispongono di meno informazioni per l'interpretazione dei dati.

Gli algoritmi di data mining Microsoft supportano i tipi di distribuzioni seguenti:

  • NORMAL
    I valori della colonna continua formano un istogramma con una distribuzione di Gauss normale.

  • Log Normal
    I valori della colonna continua formano un istogramma in cui i logaritmi dei valori seguono una distribuzione normale.

  • UNIFORM
    I valori della colonna continua formano una curva uniforme, in cui tutti i valori hanno la stessa probabilità.

Per ulteriori informazioni sugli algoritmi di data mining Microsoft, vedere Algoritmi di data mining (Analysis Services - Data mining). I provider di algoritmi di terze parti possono supportare ulteriori tipi di distribuzioni. Per determinare i tipi di distribuzioni supportati da un algoritmo, utilizzare il set di righe dello schema SUPPORTED_DISTRIBUTION_FLAGS.

Per ulteriori informazioni sui tipi di distribuzioni, vedere Distribuzioni delle colonne (Data mining).