Specificare una colonna da utilizzare come regressore in un modello
Un modello di regressione lineare rappresenta il valore dell'attributo stimabile come il risultato di una formula che consente di combinare gli input in modo che i dati si adattino il più possibile a una retta di regressione stimata. L'algoritmo accetta come input sono valori numerici e rileva automaticamente gli input che si adattano meglio.
Per specificare che una colonna può essere inclusa come regressore, è possibile tuttavia aggiungere il parametro FORCE_REGRESSOR al modello e indicare i regressori da utilizzare. Questa operazione può essere eseguita nei casi in cui l'attributo è significativo anche se l'effetto è insufficiente per essere rilevato dal modello o quando si desidera garantire che l'attributo venga incluso nella formula.
Di seguito viene descritto come creare un modello di regressione lineare semplice utilizzando gli stessi dati di esempio utilizzati per l'esercitazione sulle reti neurali. Sebbene non sia necessariamente affidabile, il modello dimostra i concetti di base per utilizzare Progettazione modelli di data mining per personalizzare un modello di regressione lineare.
Come creare un semplice modello di regressione lineare
In SQL Server Data Tools (SSDT) espandere Strutture di data mining in Esplora soluzioni.
Fare doppio clic su Call Center.dmm per aprirlo nella finestra di progettazione.
Scegliere Nuovo modello di data mining dal menu Modello di data mining.
Selezionare Microsoft Linear Regression come algoritmo e digitare Regressione Call Center come nome.
Nella scheda Modelli di data mining modificare l'utilizzo delle colonne come indicato di seguito. È necessario impostare su Ignora tutte le colonne non presenti nell'elenco seguente, se tale impostazione non è già specificata.
FactCallCenterID Key
ServiceGrade PredictOnly
Total Operators Input
AverageTimePerIssue Input
Scegliere l'opzione per l'impostazione dei parametri del modello dal menu Modello di data mining.
Per il parametro FORCE_REGRESSOR, nella colonna Valore digitare i nomi di colonna racchiusi tra parentesi quadre e separati da una virgola come indicato di seguito:
[Average Time Per Issue],[Total Operators]
[!NOTA]
Le colonne che rappresentano i regressori migliori verranno rilevate automaticamente. È necessario applicare i regressori solo quando si desidera garantire che una colonna venga inclusa nella formula finale.
Scegliere Elabora modello dal menu Modello di data mining.
Nel visualizzatore il modello è rappresentato da un nodo singolo che contiene la formula di regressione. È possibile visualizzare la formula in Legenda data mining oppure è possibile utilizzare le query per estrarre i coefficienti per la formula.
Vedere anche
Riferimento
Riferimento tecnico per l'algoritmo Microsoft Linear Regression