Esplorazione del modello Call Center (Esercitazione intermedia sul data mining)

Dopo aver compilato il modello esplorativo, è possibile utilizzarlo per ottenere ulteriori informazioni sui dati tramite gli strumenti seguenti disponibili in Business Intelligence Development Studio.

  • Visualizzatore Microsoft Neural Network**:** questo visualizzatore è disponibile nella scheda Visualizzatore modello di data mining di Progettazione modelli di data mining ed è stato progettato per consentire di sperimentare le interazioni tra i dati.

  • Microsoft Generic Content Tree Viewer**:** questo visualizzatore standard fornisce informazioni dettagliate sui modelli e le statistiche individuati dall'algoritmo durante la generazione del modello.

  • Progettazione vista origine dati**:** questo visualizzatore fornisce tabelle, grafici e grafici e tabelle pivot per facilitare l'esplorazione dei dati di origine. Tornare ai dati di origine può risultare molto utile per capire le tendenze evidenziate dal modello.

Visualizzatore Microsoft Neural Network

Questo visualizzatore dispone di tre riquadri: Input, Output e Variabili.

Nel riquadro Output è possibile selezionare valori diversi per l'attributo stimabile o la variabile dipendente. Se il modello contiene più attributi stimabili, è possibile selezionare l'attributo dall'elenco Attributo output.

Nel riquadro Variabili vengono confrontati i due risultati scelti per gli attributi o le variabili. Le barre colorate rappresentano visivamente l'impatto della variabile sui risultati di destinazione. È possibile visualizzare anche punteggi di accuratezza per le variabili. I punteggi di accuratezza vengono calcolati in modo diverso a seconda del tipo di modello di data mining utilizzato, ma indica in generale il miglioramento del modello in caso di utilizzo dell'attributo per la stima.

Il riquadro Input consente di aggiungere fattori di influenza al modello per provare vari scenari di simulazione.

Utilizzo del riquadro Output

In questo modello iniziale interessa vedere come i vari fattori influiscono sul livello del servizio. A questo scopo, è possibile selezionare Service Grade dall'elenco degli attributi di output, quindi confrontare i vari livelli di servizio selezionando intervalli diversi negli elenchi a discesa Valore 1 e Valore 2.

Per confrontare i livelli di servizio più basso e più elevato

  1. In Valore 1 selezionare l'intervallo con i valori più bassi. Ad esempio, l'intervallo 0-0-0,7 rappresenta la frequenza di abbandono più bassa e pertanto il migliore livello di servizio.

    Nota

    I valori esatti di questo intervallo possono variare a seconda di come è stato configurato il modello.

  2. In Valore 2 selezionare l'intervallo con i valori più elevati. Ad esempio, l'intervallo con il valore >= 0,12 rappresenta la frequenza di abbandono più elevata e pertanto il livello di servizio peggiore. In altre parole, il 12% dei clienti che ha telefonato durante questo turno ha riagganciato prima di parlare con un rappresentante.

    Il contenuto del riquadro Variabili viene aggiornato per confrontare gli attributi che contribuiscono ai valori risultanti. Nella colonna sinistra vengono pertanto elencati gli attributi associati al migliore livello di servizio, mentre nella colonna destra vengono elencati gli attributi associati al peggiore livello di servizio.

Utilizzo del riquadro Variabili

In questo modello Average Time Per Issue rappresenta un fattore importante. Questa variabile indica il tempo medio necessario per rispondere a una chiamata, indipendentemente dal tipo di chiamata.

Per visualizzare e copiare i punteggi di probabilità e accuratezza per un attributo

  1. Nel riquadro Variabili posizionare il mouse sulla barra colorata nella prima riga.

    Questa barra colorata indica quanto la variabile Average Time Per Issue contribuisca al livello del servizio. La descrizione comando indica un punteggio complessivo e i punteggi di probabilità e accuratezza per ogni combinazione di una variabile e un risultato di destinazione.

  2. Nel riquadro Variabili fare clic con il pulsante destro del mouse su una barra colorata e scegliere Copia.

  3. In un foglio di lavoro di Excel fare clic con il pulsante destro del mouse su una cella qualsiasi e scegliere Incolla.

    Il report verrà incollato come tabella HTML e includerà solo i punteggi per ogni barra.

  4. In un foglio di lavoro di Excel diverso fare clic con il pulsante destro del mouse su una cella qualsiasi e scegliere Incolla speciale.

    Il report verrà incollato in formato testo e includerà le statistiche correlate descritte nella sezione successiva.

Utilizzo del riquadro Input

Si supponga di essere interessati all'analisi dell'effetto di un particolare fattore, ad esempio il turno o il numero di operatori. È possibile selezionare una determinata variabile tramite il riquadro Input. Il riquadro Variabili verrà aggiornato automaticamente in modo da confrontare i due gruppi selezionati in precedenza in base alla variabile specificata.

Per rivedere l'effetto sul livello di servizio modificando gli attributi di input

  1. Nel riquadro Input in Attributo selezionare Shift.

  2. In Valore selezionare AM.

    Il riquadro Variabili verrà aggiornato per illustrare l'impatto sul modello quando il turno è AM. Tutte le altre selezioni rimarranno invariate, in quanto si confrontano ancora i livelli di servizio più basso e più elevato.

  3. In Valore selezionare PM1.

    Il riquadro Variabili verrà aggiornato per illustrare l'impatto sul modello al variare del turno.

  4. Nel riquadro Input fare clic sulla riga vuota successiva al di sotto di Attributo e selezionare Calls. In Valore selezionare l'intervallo che indica il maggior numero di chiamate.

    All'elenco verrà aggiunta una nuova condizione di input. Il riquadro Variabili verrà aggiornato per illustrare l'impatto sul modello per un determinato turno quando il volume di chiamate è massimo.

  5. Continuare a modificare i valori per Shift e Calls per trovare eventuali correlazioni interessanti tra turno, volume di chiamate e livello del servizio.

    Nota

    Per cancellare il contenuto del riquadro Input in modo che sia possibile utilizzare altri attributi, fare clic su Aggiorna contenuto visualizzatore.

Interpretazione delle statistiche presenti nel visualizzatore

Tempi di attesa più lunghi rappresentano un importante criterio di stima di una frequenza di abbandono elevata, che indica un livello di servizio insufficiente. Sebbene possa sembrare una conclusione ovvia, il modello di data mining fornisce dati statistici aggiuntivi per l'interpretazione di queste tendenze.

  • Punteggio: valore che indica l'importanza complessiva della variabile per l'analisi discriminante tra risultati. Più elevato è il punteggio, maggiore sarà l'effetto della variabile sul risultato.

  • Probabilità di Valore 1: percentuale che rappresenta la probabilità del valore di ottenere il risultato indicato.

  • Probabilità di Valore 2: percentuale che rappresenta la probabilità del valore di ottenere il risultato indicato.

  • Accuratezza per Valore 1 e Accuratezza per Valore 2: punteggi che rappresentano l'impatto dell'utilizzo di questa variabile specifica per stimare i risultati di Valore 1 e Valore 2. Più elevato è il punteggio, migliore risulterà la variabile per la stima dei risultati.

La tabella seguente contiene alcuni valori di esempio per i principali fattori di influenza. Ad esempio, Probabilità di Valore 1 è 60,6% e Probabilità di Valore 2 è 8,30%, pertanto, quando Average Time Per Issue si trova nell'intervallo di 44-70 minuti, il 60,6% dei casi sono nel turno con i livelli di servizio più elevati (Valore 1) e l'8,30% nel turno con i livelli di servizio più bassi (Valore 2).

Da queste informazioni è possibile trarre alcune conclusioni. I tempi di risposta alle chiamate più brevi (intervallo 44-70) influiscono decisamente su un livello di servizio migliore (intervallo 0,00-0,07). Il punteggio (92,35) suggerisce che questa variabile è molto importante.

Tuttavia, analizzando l'elenco dei fattori di influenza, è possibile notare altri fattori con effetti più complessi e più difficili da interpretare. Ad esempio, il turno sembra influire sul servizio, ma i punteggi di accuratezza e le probabilità relative indicano che il turno non è un fattore principale.

Attributo

Valore

Predilige < 0,07

Predilige >= 0,12

Average Time Per Issue

89.087 - 120.000

  

Punteggio: 100
Probabilità di Valore 1: 4,45%
Probabilità di Valore 2: 51,94%
Accuratezza per Valore 1: 0,19
Accuratezza per Valore 2: 1,94

Average Time Per Issue

44.000 - 70.597

Punteggio: 92,35
Probabilità di Valore 1: 60,06%
Probabilità di Valore 2: 8,30%
Accuratezza per Valore 1: 2,61
Accuratezza per Valore 2: 0,31

  

Torna all'inizio

Microsoft Generic Content Tree Viewer

Questo visualizzatore può essere utilizzato per visualizzare informazioni ancora più dettagliate create dall'algoritmo quando il modello viene elaborato. In MicrosoftGeneric Content Tree Viewer il modello di data mining viene rappresentato come una serie di nodi, in cui ogni nodo rappresenta le informazioni relative ai dati dell'esercitazione. Questo visualizzatore può essere utilizzato con tutti i modelli, ma il contenuto dei nodi è diverso a seconda del tipo di modello.

Per i modelli di rete neurale o i modelli di regressione logistica, il marginal statistics node può risultare particolarmente utile. Questo nodo contiene statistiche derivate sulla distribuzione di valori nei dati. Queste informazioni possono risultare utili se si desidera ottenere un riepilogo dei dati senza dovere scrivere molte query T-SQL. Il grafico dei valori per la creazione di contenitori nell'argomento precedente deriva dal nodo delle statistiche marginali.

Per ottenere un riepilogo dei valori dei dati dal modello di data mining

  1. In Progettazione modelli di data mining selezionare <nome modello di data mining> nella scheda Visualizzatore modello di data mining.

  2. Dall'elenco Visualizzatore selezionare Microsoft Generic Content Tree Viewer.

    La vista del modello di data mining verrà aggiornata per visualizzare una gerarchia di nodi nel riquadro sinistro e una tabella HTML nel riquadro destro.

  3. Nel riquadro Didascalia nodo fare clic sul nodo denominato 10000000000000000.

    Il nodo di livello più alto in qualsiasi modello è sempre il nodo radice del modello. In un modello di rete neurale o di regressione logistica il nodo immediatamente successivo è il nodo delle statistiche marginali.

  4. Scorrere il riquadro Dettagli nodo fino alla riga NODE_DISTRIBUTION.

  5. Scorrere la tabella NODE_DISTRIBUTION per visualizzare la distribuzione dei valori calcolati dall'algoritmo Microsoft Neural Network.

Per utilizzare questi dati in un report, è possibile selezionare e copiare le informazioni per le righe specifiche oppure utilizzare la query DMX (Data Mining Extensions) seguente per estrarre il contenuto completo del nodo.

SELECT * 
FROM [Call Center EQ4].CONTENT
WHERE NODE_NAME = '10000000000000000'

È inoltre possibile utilizzare la gerarchia di nodi e i dettagli nella tabella NODE_DISTRIBUTION per attraversare singoli percorsi della rete neurale e visualizzare statistiche del livello nascosto. Per ulteriori informazioni, vedere Esecuzione di query su un modello di rete neurale (Analysis Services - Data mining).

Torna all'inizio

Progettazione vista origine dati

Questo visualizzatore viene utilizzato per la compilazione di una struttura di data mining o di un cubo, ma fornisce anche vari strumenti utili per comprendere meglio i dati di origine. Se ad esempio il modello ha individuato una tendenza che non si comprende pienamente, è possibile visualizzare righe singole in dati sottostanti o creare riepiloghi o grafici che possono aiutare a capire le correlazioni.

In questa sezione viene fornito un esempio di come è possibile utilizzare Progettazione vista origine dati per esplorare le tendenze individuate dal modello senza dover copiare dati in Excel o eseguire più query T-SQL sull'origine dati.

In questo scenario si creeranno alcuni grafici che illustrano la correlazione tra tempo di risposta e livello del servizio trovati dal modello.

Per creare un grafico pivot che illustra una tendenza rilevata dal modello di data mining

  1. In Esplora soluzioni fare doppio clic su Call Center.dsv in Viste origine dati.

  2. Nella scheda Call Center.dsv fare clic con il pulsante destro del mouse sulla tabella FactCallCenter e scegliere Esplorazione dati.

    Verrà visualizzata una nuova scheda denominata Esplora tabella FactCallCenter. Questa scheda contiene quattro sezioni in schede diverse: Tabella, Tabella pivot, Grafico e Grafico pivot.

  3. Fare clic sulla scheda Grafico pivot.

  4. In Elenco campi del grafico selezionare AverageTimePerIssue, quindi trascinarlo nell'area del grafico, nella casella denominata Rilasciare qui i campi categoria.

    Poiché i dati di origine provengono da una tabella semplice, la gerarchia in Elenco campi del grafico contiene le stesse informazioni a livello di gerarchia e a livello di campo. Tuttavia, se si utilizza un cubo o una dimensione, la gerarchia potrebbe contenere più membri. Ad esempio, una gerarchia relativa alla data potrebbe contenere campi quali Trimestre, Mese o Giorno. È possibile trascinare l'intera gerarchia o un solo membro della gerarchia nel grafico.

  5. In Elenco campi del grafico trovare ServiceGrade e trascinarlo nel centro dell'area del grafico.

    Il grafico verrà aggiornato e verrà aggiunta una casella denominata Somma di ServiceGrade all'inizio del grafico.

  6. Nella barra degli strumenti fare clic sull'icona sigma e selezionare Media.

    Il titolo verrà aggiornato in Media di ServiceGrade.

  7. In Elenco campi del grafico selezionare Shift, quindi trascinarlo nell'area del grafico, nella casella denominata Rilasciare qui i campi filtro. Trascinare WageType da Elenco campi del grafico e rilasciarlo accanto a Shift.

    È ora possibile filtrare in base al turno per vedere se la tendenza è diversa a seconda del turno o se il giorno è festivo o lavorativo.

  8. Selezionare AverageTimePerIssue nella parte inferiore del grafico e trascinarlo di nuovo in Elenco campi del grafico.

  9. In Elenco campi del grafico selezionare AverageTimePerLevelTwoOperators, quindi trascinarlo nella casella denominata Rilasciare qui i campi categoria dell'area del grafico.

    Il grafico verrà aggiornato per illustrare la correlazione tra un aumento del numero di operatori e il livello del servizio medio. Sembra non essere una relazione lineare. È possibile continuare a sperimentare trascinando nuovi campi nel grafico o modificando il tipo di grafico.

Si noti tuttavia che questi grafici possono visualizzare in genere solo alcuni attributi per volta, mentre l'algoritmo Microsoft Neural Network analizza molte interazioni complesse fra più input. Inoltre, il modello di rete neurale rileva molte correlazioni troppo complicate per essere rappresentate in un grafico.

Se si desidera esportare i diagrammi o creare una presentazione di un modello di rete neurale complesso, è inoltre possibile utilizzare i modelli di data mining per Visio. Questo componente aggiuntivo gratuito per Visio 2007 fornisce diagrammi sofisticati e personalizzabili per i modelli di data mining che è possibile utilizzare per presentazioni o report. Per ulteriori informazioni, vedere Componenti aggiuntivi Data mining per Office 2007.

Torna all'inizio