Aggiunta di una vista origine dati per i dati del call center (Esercitazione intermedia sul data mining)

In questa attività verrà aggiunta una vista origine dati da utilizzare per accedere ai dati del call center. Gli stessi dati verranno utilizzati per compilare sia il modello di rete neurale iniziale per l'esplorazione, sia il modello di regressione logistica che verrà utilizzato per preparare i consigli.

Si utilizzerà inoltre la finestra di progettazione Vista origine dati per aggiungere una colonna per il giorno feriale. Questa operazione è necessaria poiché, anche se i dati di origine tengono traccia dei dati del call center in base alle date, l'esperienza insegna che sono presenti modelli ricorrenti sia in termini di volume di chiamate che di qualità del servizio, a seconda se il giorno è un fine settimana o un giorno feriale.

Procedure

Per aggiungere una vista origine dati

  1. In Esplora soluzioni fare clic con il pulsante destro del mouse su Viste origine dati e scegliere Nuova vista origine dati.

    Verrà avviata Creazione guidata vista origine dati.

  2. Nella pagina iniziale della Creazione guidata vista origine dati fare clic su Avanti.

  3. Nella pagina Selezionare un'origine dati, sotto Origini dati relazionali, selezionare l''origine dati  Adventure Works DW Multidimensional 2012 . Se questa origine dati non è disponibile, vedere Esercitazione di base sul data mining. Scegliere Avanti.

  4. Nella pagina Selezione tabelle e viste selezionare la tabella seguente, quindi fare clic sulla freccia DESTRA per aggiungerla alla vista origine dati:

    • FactCallCenter (dbo)

    • DimDate

  5. Scegliere Avanti.

  6. Nella pagina Completamento procedura guidata per impostazione predefinita la vista origine dati è denominata Adventure Works DW Multidimensional 2012 . Modificare il nome in CallCenter, quindi fare clic su Fine.

    Verrà aperta la finestra di progettazione Vista origine dati in cui è visualizzata la vista origine dati CallCenter.

  7. Fare clic con il pulsante destro del mouse nel riquadro Vista origine dati e scegliere Aggiungi/Rimuovi tabelle. Selezionare la tabella DimDate e fare clic su OK.

    Tra le colonne DateKey di ogni tabella verrà aggiunta automaticamente una relazione. Si utilizzerà questa relazione per ottenere la colonna EnglishDayNameOfWeek dalla tabella DimDate e utilizzarla nel modello.

  8. Nella finestra di progettazione Vista origine dati fare clic con il pulsante destro del mouse sulla tabella FactCallCenter e scegliere Nuovo calcolo denominato.

    Nella finestra di dialogo Crea calcolo denominato digitare i valori seguenti:

    Nome colonna

    DayOfWeek

    Descrizione

    Ottenere il giorno di settimana dalla tabella DimDate

    Espressione

    (SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)

    Per verificare che l'espressione crei i dati necessari, fare clic con il pulsante destro del mouse sulla tabella FactCallCenter, quindi scegliere Esplora dati.

  9. Rivedere i dati disponibili, in modo da comprendere come vengono utilizzati nel data mining:

Nome colonna

Contiene

FactCallCenterID

Una chiave arbitraria creata durante l'importazione dei dati nel data warehouse.

Questa colonna identifica record univoci e deve essere utilizzata come chiave del case per il modello di data mining.

DateKey

La data dell'operazione del call center, espressa come un Integer. Le chiavi della data di tipo Integer vengono spesso utilizzate nei data warehouse, ma è consigliabile ottenere la data nel formato di data/ora se si prevede di eseguire il raggruppamento in base ai valori di data.

Le date non sono univoche perché il fornitore presenta un report distinto per ogni turno di ogni giorno lavorativo.

WageType

Viene indicato se il giorno è un giorno feriale, festivo o un fine settimana.

È possibile che la qualità del servizio clienti sia diversa nei fine settimana rispetto ai giorni feriali, quindi si utilizzerà questa colonna come input.

Shift

Indica il turno per il quale vengono registrate le chiamate. In questo call center la giornata lavorativa viene divisa in quattro turni: AM, PM1, PM2 e Midnight.

È possibile che il turno influisca sulla qualità del servizio clienti, quindi si utilizzerà questa colonna come input.

LevelOneOperators

Indica il numero di operatori di livello 1 in servizio.

I dipendenti del call center iniziano a Livello 1, pertanto questi dipendenti sono meno esperti.

LevelTwoOperators

Indica il numero di operatori di livello 2 in servizio.

Per qualificarsi come operatore di livello 2, un dipendente deve registrare un determinato numero di ore di servizio.

TotalOperators

Numero complessivo di operatori presenti durante il turno.

Calls

Numero di chiamate ricevute durante il turno.

AutomaticResponses

Numero di chiamate gestite completamente dall'elaborazione automatica delle chiamate (Interactive Voice Response o IVR).

Orders

Numero di ordini risultanti dalle chiamate.

IssuesRaised

Numero di problemi generati dalle chiamate che richiedono una soluzione.

AverageTimePerIssue

Tempo medio richiesto per rispondere a una chiamata in entrata.

ServiceGrade

Metrica che indica la qualità generale del servizio, misurata come frequenza di abbandono per l'intero turno. Più elevata è la frequenza di abbandono, più è probabile che i clienti siano scontenti e che gli ordini potenziali non vengano conclusi.

Si noti che i dati includono quattro colonne diverse basate su una singola colonna relativa alla data: WageType, DayOfWeek, Shift e DateKey. Solitamente nel data mining non è consigliabile utilizzare più colonne derivate dagli stessi dati, in quanto i valori sono correlati troppo strettamente tra di essi e possono nascondere altri modelli.

Nel modello non si utilizzerà tuttavia DateKey, poiché contiene troppi valori univoci. Non esiste una relazione diretta tra Shift e DayOfWeek e WageType e DayOfWeek sono correlati solo in parte. Se la collinearità è importante, è possibile creare la struttura utilizzando tutte le colonne disponibili, quindi ignorare le colonne diverse in ogni modello e testare l'effetto.

Attività successiva della lezione

Creazione di una struttura e di un modello di rete neurale (Esercitazione intermedia sul data mining)

Vedere anche

Concetti

Viste origine dati in modelli multidimensionali