Preparare il caricamento di un file di dati dell'organizzazione
L'app Advanced Insights può ottenere i dati dell'organizzazione in uno dei due modi seguenti: tramite Microsoft Entra ID, ovvero l'impostazione predefinita, o tramite un file di dati dell'organizzazione caricato dall'amministratore. In questo articolo viene illustrata la seconda opzione, il file di dati dell'organizzazione. Continua a leggere per scoprire cosa deve fare l'amministratore per identificare, raccogliere e strutturare i dati prima di caricare i dati dell'organizzazione.
Per informazioni sui dati dell'organizzazione in generale, scoprire quali dati Microsoft Entra ID vengono sincronizzati automaticamente con Viva Insights e per ottenere una panoramica della pagina Dati dell'organizzazione nell'esperienza di amministrazione delle informazioni dettagliate avanzate, vedere Dati dell'organizzazione in Viva Insights.
Importante
Dopo aver caricato un file .csv con dati dell'organizzazione, non sarà possibile tornare all'uso di Microsoft Entra ID. È necessario caricare regolarmente .csv file per mantenere aggiornati i dati dell'organizzazione.
Preparare i dati organizzativi
Quando si è pronti per iniziare a usare un file di dati dell'organizzazione, le sezioni seguenti illustrano il processo di preparazione dei dati:
- Identificare le tendenze da analizzare : decidere quali tendenze è necessario conoscere per migliorare l'efficienza sul lavoro. Dopo aver identificato queste tendenze, è possibile scegliere meglio quali dati dell'organizzazione usare.
- Conoscere i dati da includere : sono necessari alcuni attributi di dati e molti sono facoltativi. Tra quelli facoltativi, scegliere gli attributi che meglio rispondono ai propri scopi analitici.
- Ottenere un'esportazione dei dati dell'organizzazione : fare in modo che un amministratore esporti i dati delle risorse umane dal sistema di risorse umane dell'organizzazione. Facoltativamente, includere i dati line-of-business, se l'analisi lo richiede.
- Strutturare i dati dell'organizzazione : per convalidare correttamente i dati, è necessario innanzitutto strutturarli correttamente nel file .csv caricato.
- Caricare il file di dati dell'organizzazione : dopo che il file di .csv è pronto, viene caricato nell'app Advanced Insights in cui, dopo la convalida e l'elaborazione, diventa disponibile per l'analisi.
Passaggio 1: Identificare le tendenze da analizzare
Per conoscere i dati dell'organizzazione da estrarre, è prima di tutto necessario decidere quali tendenze dell'area di lavoro si desidera conoscere. Ad esempio, in un'analisi futura, è possibile esaminare la collaborazione tra diversi segmenti di dipendenti o gruppi. È prima di tutto necessario definire questi gruppi, che è possibile eseguire in vari modi:
- In base ai dati dell'organizzazione
- Per livelli di gerarchia dell'organizzazione
- Per prestazioni, engagement o altri dati line-of-business
I gruppi definiti possono essere usati negli esempi di analisi seguenti:
Collaborazione tra gruppi
Uno scenario di analisi comune consiste nel trovare modelli di collaborazione tra diversi gruppi di dipendenti. Ad esempio, si potrebbe voler sapere quanto il team di marketing del prodotto sta parlando con il team di vendita.
Gli attributi per la segmentazione delle popolazioni possono essere utili da considerare nella definizione dei modelli di collaborazione, ad esempio:
- Attributi della famiglia di processi o del ruolo, ad esempio professione, funzione, disciplina e codice del processo
- Organizzazione, line-of-business o centro di costo, ad esempio risorse umane, finanza, vendite e marketing
- Attributi di posizione, ad esempio città, stato, paese e aree geografiche, come definito dall'organizzazione
- Attributi che descrivono il proprio lavoro, ad esempio remoto, dipendente a tempo pieno o fornitore
La maggior parte di questi attributi è disponibile all'interno dei sistemi informativi hr.
Collaborazione gerarchica
È anche comune cercare modelli di comportamento di collaborazione in riferimento alla gerarchia dell'organizzazione. È anche possibile quantificare la collaborazione tra manager e singoli collaboratori e tra livelli superiori e inferiori nell'organizzazione.
In questo tipo di analisi sono utili i concetti seguenti:
- IC o manager : se un dipendente è un singolo collaboratore o un manager.
- Gerarchia organizzativa : ad esempio, i nomi di tutti i manager al di sopra del dipendente nella struttura di report di tale dipendente; ogni manager può essere archiviato come attributo separato.
- Livello : ad esempio, la posizione del dipendente nella gerarchia organizzativa in cui il livello 0 = il leader principale dell'azienda.
- Intervallo : ad esempio, il numero di report diretti assegnati a un dipendente.
- Livello : ad esempio, senior manager, VP, director, CVP.
La maggior parte di questi attributi si trova anche nei sistemi informativi hr.
Dati di collaborazione, coinvolgimento e risultati
Infine, è possibile prendere in considerazione la possibilità di associare i modelli di comportamento di collaborazione ai punteggi di coinvolgimento dei dipendenti o ad altri dati sui risultati delle prestazioni. Questi dati possono includere il raggiungimento della quota di vendita o le valutazioni delle prestazioni. Questi dati si trovano spesso al di fuori dei sistemi informativi hr tradizionali, in repository di dati HR separati o in sistemi line-of-business.
Passaggio 2: Conoscere i dati da includere
Per ottenere funzionalità complete dall'app Advanced Insights è necessario fornire diversi attributi obbligatori, come descritto in Riferimento agli attributi. Inoltre, è possibile fornire fino a 100 attributi facoltativi per raggruppare e filtrare i dati in modi interessanti e personalizzati.
Esempi di dati aziendali includono la famiglia di processi, il ruolo del lavoro, l'organizzazione e la linea di business. Questi dati vengono forniti all'app Advanced Insights a livello individuale, il che significa che questi attributi forniscono contesto a ogni persona nel set di dati.
Dipendenti da includere
Includere almeno i dati dell'organizzazione per tutti i dipendenti che dispongono di licenze Viva Insights. È ancora meglio includere ogni persona nell'azienda come parte del caricamento dei dati, anche se si prevede di raccogliere dati di collaborazione solo per un sottogruppo, ovvero una popolazione di destinazione specifica all'interno dell'azienda.
Ad esempio, se le persone in Marketing comunicano frequentemente con gli utenti in Sviluppo prodotto, ma l'app ha dati sulle risorse umane solo sull'organizzazione marketing, non è possibile creare report per mostrare quanto tempo il marketing sta spendendo con lo sviluppo del prodotto.
Se non è possibile includere ogni persona nell'organizzazione, il minimo da includere sono tutte le persone per cui vengono raccolti i dati di collaborazione. Questo minimo consente di analizzare i modelli di collaborazione tra gruppi all'interno di questa popolazione, ma non tra gruppi esterni alla popolazione.
Inclusi tutti i dipendenti con licenza
È responsabilità dell'amministratore mantenere aggiornati e completi i dati dell'organizzazione. In questa attività, "completa" significa due cose: i dati che includono le persone giuste e includono gli attributi corretti per tali persone.
Il motivo per l'inclusione di tutti i dipendenti con licenza nell'organizzazione è che, se mancano i dati dell'organizzazione, gli analisti non possono filtrare in base a tali dati quando compilano una query nella pagina Analisi . Pertanto, i dipendenti i cui dati mancano sono esclusi dalle analisi eseguite dagli analisti.
Importante
Assicurarsi che l'amministratore di Microsoft 365 abbia assegnato licenze a tutti i dipendenti che si desidera includere nei report. Anche se si include un dipendente nel file di dati dell'organizzazione, sarà necessaria una licenza per essere visualizzato nei report. Per altre informazioni sulle licenze e sui report, vedere Quando gli utenti vengono visualizzati nei risultati delle query.
Notifica dei dati mancanti
Se l'app rileva che i dati sono mancanti per uno o più dipendenti con licenza, avvisa gli amministratori tramite una notifica popup nell'angolo in alto a destra della scheda Connessioni dati .
Caricare i dati dell'organizzazione mancanti
Per caricare i dati mancanti, l'amministratore può seguire questa procedura:
- Nella notifica popup selezionare Scarica per scaricare un file .csv contenente i nomi dei dipendenti con licenza i cui dati dell'organizzazione sono mancanti.
- Aprire il file .csv.
- Aggiungere i dati mancanti per questi dipendenti. Ciò significa aggiungere attributi (colonne) che descrivono i dipendenti in modo coerente con i caricamenti precedenti.
- Caricare il file. Per altre informazioni, vedere Caricare i dati dell'organizzazione (caricamento successivo).
Oltre a includere tutti i dipendenti con licenza nel caricamento dei dati dell'organizzazione, è consigliabile includere anche i dipendenti senza licenza, come illustrato in precedenza.
Passaggio 3: Ottenere un'esportazione dei dati dell'organizzazione
Prima di formattare e caricare i dati dell'organizzazione, è necessario recuperarli da una o più origini. L'origine principale è il team che gestisce i sistemi informativi delle risorse umane dell'organizzazione. Questo team deve fornire un'esportazione dei dati degli attributi hr per i singoli dipendenti.
Inoltre, gli analisti potrebbero avere bisogno di dati sui risultati aziendali. In tal caso, è necessario contattare i proprietari line-of-business che hanno accesso agli archivi dati che contengono queste informazioni. Ad esempio, questi dati possono includere:
- Dati di revisione delle prestazioni per gruppi di lavoro specifici.
- Punteggi di coinvolgimento dei dipendenti acquisiti dalle risorse umane al di fuori dei sistemi informativi delle risorse umane.
- Dati relativi alle vendite o ad altri livelli di raggiungimento delle quote che offrono più visualizzazioni delle prestazioni.
- Dati del sondaggio dei dipendenti.
Dopo aver ottenuto questi dati, sarà necessario strutturarli per un'elaborazione corretta dopo il caricamento nell'app.
Passaggio 4: Strutturare i dati dell'organizzazione
Dopo aver ottenuto i dati esportati, strutturarli nel formato corretto.
Aggiungere attributi obbligatori, facoltativi riservati e personalizzati
Esistono tre tipi di attributi che è possibile aggiungere nel file di dati dell'organizzazione: obbligatorio, facoltativo riservato e personalizzato.
Obbligatorio
Specificare gli attributi seguenti come intestazioni di colonna, esattamente come scritto di seguito, nel .csv caricamento.
-
EffectiveDate
- Assicurarsi che la colonna EffectiveDate contenga valori in tutte le righe. Se non si specifica una colonna EffectiveDate nel caricamento, la data di caricamento dei dati diventa l'oggetto EffectiveDate predefinito.
- PersonId
- ManagerId
- Organizzazione (distinzione tra maiuscole e minuscole)
Riservato facoltativo
Gli attributi seguenti sono intestazioni di colonna riservate per gli attributi attualmente usati per calcolare, filtrare e raggruppare i dati. A seconda del modello di Power BI specifico, potrebbero essere necessari attributi diversi rispetto all'elenco seguente.
- LevelDesignation
- FunctionType
- HireDate
- HourlyRate
- Livello
- SupervisorIndicator
- WeeklyBadgeOnsiteDays
- Posizione
Nota
Gli attributi possono essere in qualsiasi ordine nel file. Tuttavia, i nomi di questi attributi obbligatori e riservati non possono essere usati come nomi di nuovi attributi personalizzati.
Attributi personalizzati
Gli attributi personalizzati sono qualsiasi altro attributo da definire da usare per filtrare e raggruppare i dati. Quando si caricano questi attributi, gli analisti possono usarli durante la compilazione di query. Per informazioni su come caricare attributi personalizzati, vedere Caricare i dati dell'organizzazione (primo caricamento).
Nota
- Il numero massimo di attributi totali consentiti nel sistema è 105, che include i cinque attributi necessari.
- Tutti i campi numerici, ad esempio l'attributo obbligatorio "HourlyRate", devono essere nel formato "number" e non possono contenere virgole o un segno di dollaro.
Consiglio
Per altre informazioni sulla formattazione del file, vedere l'articolo Regole file ed errori di convalida .
Esempio .csv file di esportazione
Ecco un frammento di codice di esempio di un file di esportazione .csv valido:
PersonId,EffectiveDate,HireDate,ManagerId,LevelDesignation,Organization,Layer,Area Emp1@contoso.com,12/1/2020,1/3/2014,Mgr1@contoso.com,Junior IC,Sales,8,Southeast Emp2@contoso.com,11/1/2020,1/3/2014,Mgr1@contoso.com,Junior IC,Sales,8,Southeast Emp3@contoso.com,12/1/2020,1/3/2014,Mgr2@contoso.com,Manager,Sales,7,Northeast Emp4@contoso.com,10/1/2020,8/15/2015,Mgr3@contoso.com,Support,Sales,9,Midwest Emp5@contoso.com,11/1/2020,8/15/2015,Mgr3@contoso.com,Support,Sales,9,Midwest Emp6@contoso.com,12/1/2020,8/15/2015,Mgr3@contoso.com,Support,Sales,9,Midwest
Per altre informazioni sugli attributi, vedere la sezione Riferimento agli attributi.
Passaggio 5: Caricare il file di dati dell'organizzazione
Dopo aver creato un file di .csv di origine, è possibile caricarlo nell'app Advanced Insights tramite la pagina > Dati dell'organizzazione Hub dati o Connessioni dati .
Se questa è la prima volta che si caricano i dati dell'organizzazione, vedere Caricare i dati dell'organizzazione (primo caricamento).If this is the first time you upload organizational data, refer to Upload organizational data (first upload). Se questa non è la prima volta, vedere Caricare i dati dell'organizzazione (caricamenti successivi).
Dopo il caricamento dei dati, l'app esegue più convalida ed elaborazione per completare il provisioning.
Frequenza di caricamento di un file di dati dell'organizzazione .csv
È consigliabile caricare i dati dei dipendenti almeno una volta al mese per mantenere aggiornati i dati e l'analisi pertinente. Subito dopo l'esito positivo del caricamento dei dati di un dipendente, i dati aggiornati diventano disponibili per consentire agli utenti di visualizzare informazioni dettagliate nell'app.
Fornitura di dati in un periodo di tempo
Per impostazione predefinita, Viva Insights include dati di riunione e posta elettronica per i dipendenti misurati per un anno. I dati dell'organizzazione vengono forniti per Viva Insights con una data di validità associata a ogni riga nel file di caricamento.
Se si esegue un'esportazione temporizzato dei dati dell'organizzazione dal sistema informativo delle risorse umane a partire dalla data corrente, si ottiene un'immagine della popolazione dei dipendenti per quel singolo punto nel tempo. Per garantire la massima fedeltà dei dati durante il provisioning, è necessario fornire esportazioni di dati dell'organizzazione per ognuno degli ultimi 13 mesi. Questi dati possono essere forniti in un singolo file o in una sequenza di file.
Ecco come apparirebbe in pratica. Per ogni dipendente misurato, sono disponibili 13 righe separate. Ognuna di queste righe contiene una data di validità per ogni mese per cui è stato eseguito il pull dei dati. Se non è possibile specificare una data effettiva per ogni mese, è possibile specificare un singolo punto nel tempo. In tal caso, impostare la data di validità sul primo giorno del mese corrente, un anno fa. Ad esempio, se il provisioning si è verificato nell'ottobre 2020, la data di validità per tutte le righe deve essere impostata sul 10/1/2019.
L'attività di collaborazione dei dipendenti viene mappata allo snapshot dei dati aziendali più recente (basato su EffectiveDate) che precede la data dell'attività di collaborazione.
Configurazione avanzata : configurare l'indirizzo di posta elettronica per trovare il corrispondente EntraID per l'elaborazione
Viva Insights usa gli indirizzi di posta elettronica per trovare il corrispondente EntraID per l'elaborazione. Con questa configurazione avanzata, è possibile scegliere la data che Viva Insights deve usare per ottenere l'ENTRAID per ogni indirizzo di posta elettronica.
Opzione 1: EffectiveDate
Si applica se: l'origine dati tiene traccia delle modifiche apportate agli indirizzi di posta elettronica da EffectiveDate
EffectiveDate è la data in cui viene applicato un determinato valore di attributo per un dipendente. L'attributo viene applicato fino a quando non viene specificato un altro record per lo stesso attributo con un oggetto EffectiveDate diverso. Se non viene caricata alcuna proprietà EffectiveDate, la data di caricamento viene usata come impostazione predefinita.
Scenario
- L'origine dati tiene traccia delle modifiche apportate agli indirizzi di posta elettronica da EffectiveDate.
- L'indirizzo di posta elettronica è cambiato da BoSmith@contoso.com a BoJames@contoso.com per EntraID "A". Questa modifica viene registrata nel sistema HCM usando EffectiveDate.
Esempio:
14/04/2024: l'indirizzo di posta elettronica è cambiato da BoSmith@contoso.com a BoJames@contoso.com per EntraID "A". Questa modifica viene registrata nel sistema di origine HCM con una nuova riga per BoJames@contoso.com con EffectiveDate 14/04/2024.
Questo è uno snapshot esportato dal sistema di origine HCM il 15/04/2024:
PersonId EffectiveDate Organizzazione BoSmith@contoso.com 04/01/2024 ABC BoJames@contoso.com 04/14/2024 ABC 16/04/2024: il file esportato alla data dello snapshot viene caricato in Viva Insights
Selezionare EffectiveDate in Configurazione avanzata
In questo modo si garantisce che le modifiche all'indirizzo di posta elettronica vengano rilevate dal valore EffectiveDate corrispondente fornito nel file caricato.
- Dal 01/04/2024 al 14/04/2024, BoSmith@contoso.com viene usato per recuperare EntraID "A"
- Dal 14/04/2024, BoJames@contoso.com viene usato per recuperare EntraID "A"
Altre informazioni su come usare EffectiveDate per fornire dati in un periodo di tempo.
Opzione 2: Selezionare la data
Si applica se: l'origine dati non tiene traccia delle modifiche degli indirizzi di posta elettronica. L'indirizzo di posta elettronica nella data selezionata viene usato per tutte le date precedenti.
- Selezionare la data odierna se i dati sono stati esportati di recente.
- In caso contrario, selezionare una data precedente.
Scenario 1
- L'origine dati non tiene traccia delle modifiche apportate agli indirizzi di posta elettronica e i dati esportati da tale origine sono stati esportati di recente.
- L'indirizzo di posta elettronica è stato modificato per EntraID "A" e si vuole che il nuovo indirizzo di posta elettronica corrisponda a "A" per tutti i dati cronologici.
Esempio:
14/04/2024: l'indirizzo di posta elettronica è cambiato da BoSmith@contoso.com a BoJames@contoso.com per EntraID "A".
Snapshot esportato dal sistema di origine HCM il 15/04/2024:
PersonId EffectiveDate Organizzazione BoJames@contoso.com 04/01/2024 ABC 16/04/2024: il file esportato alla data dello snapshot viene caricato in Viva Insights.
Selezionare il 16/04/2024 dall'elenco a discesa
- In questo modo si garantisce che l'indirizzo di posta elettronica il 16/04/2024 (ad esempio, BoJames@contoso.com) venga usato per recuperare EntraID "A" per tutte le date precedenti.
Scenario 2
- L'origine dati non tiene traccia delle modifiche apportate agli indirizzi di posta elettronica e di recente non è stato esportato alcun dato.
- L'indirizzo di posta elettronica è stato modificato per EntraID "A" e si vuole che l'indirizzo di posta elettronica precedente corrisponda a "A" per tutti i dati cronologici.
Esempio:
Snapshot esportato dal sistema di origine HCM il 20/04/2024:
PersonId EffectiveDate Organizzazione BoSmith@contoso.com 04/01/2024 ABC 25/04/2024: l'indirizzo di posta elettronica è cambiato da BoSmith@contoso.com a BoJames@contoso.com per EntraID "A".
10/05/2024: il file esportato alla data dello snapshot viene caricato in Viva Insights.
- Selezionare il 20/04/2024 dall'elenco a discesa e non il 25/04/2024 o il 10/05/2024.
- In questo modo si garantisce che l'indirizzo di posta elettronica il 20/04/2024 (ad esempio, BoSmith@constoso.com) venga usato per recuperare EntraID "A" per tutte le date precedenti.
Riferimento all'attributo
Questa sezione contiene informazioni sugli attributi usati nei file di dati dell'organizzazione caricati nell'app Advanced Insights.
Nota
Se si condividono dati da Viva Insights con la funzionalità Dati dell'organizzazione in Microsoft 365, alcuni degli attributi elencati di seguito vengono condivisi. Qualsiasi attributo, tuttavia, che contiene Microsoft_ non sarà disponibile in Viva Insights. Altre informazioni sui dati dell'organizzazione in Microsoft 365.
Nota
Il campo "OnsiteDays" è ora "WeeklyBadgeOnsiteDays". Per altre informazioni, vedere la tabella seguente.
Viva Insights campo mappato | Descrizione | Tipo di dati | Valore di esempio | Obbligatorio o riservato |
---|---|---|---|---|
PersonId | Identificatore univoco per un record del dipendente. Può essere l'indirizzo SMTP o l'alias di posta elettronica principale del dipendente. | Posta elettronica | joe@contoso.com |
Obbligatorio1 |
ManagerId | Identificatore univoco per il manager di un dipendente. Può essere l'indirizzo SMTP o l'alias di posta elettronica primario del manager. Per gli amministratori delegati, questo può essere lasciato vuoto. | Posta elettronica | sally@contoso.com |
Obbligatorio |
Organizzazione | Organizzazione interna a cui appartiene un dipendente. Per informazioni dettagliate più utili, evitare di usare troppe o poche organizzazioni univoche. | Stringa | Financial Planning and Analysis |
Obbligatorio |
EffectiveDate | DateTime | 12/31/2021 |
Obbligatorio2 | |
LevelDesignation | Livello che rappresenta l'esperienza, il livello di gestione o l'anzianità di un dipendente all'interno dell'organizzazione. Per informazioni dettagliate più interattive, evitare di usare un numero eccessivo o insufficiente di valori LevelDesignation univoci. | Stringa | Director |
Riservato3 |
FunctionType | Funzione del processo eseguita da un dipendente. Per informazioni dettagliate più interattive, evitare di usare un numero eccessivo o insufficiente di functiontypes univoci | Stringa | Finance Management |
Riservato |
HireDate | DateTime | 12/31/2021 |
Riservato | |
HourlyRate | Lo stipendio di un dipendente rappresentava una tariffa oraria in dollari USA. | Double | 25.25 |
Riservato |
Livello | Posizione di un dipendente all'interno della gerarchia organizzativa, espressa come distanza dal leader principale dell'organizzazione. Ad esempio, il CEO si trova al livello 0. Per informazioni dettagliate più interattive, evitare di usare troppi o pochi livelli univoci. | Numero intero | 2 |
Riservato |
SupervisorIndicator | Stato del manager di un dipendente come IC (collaboratore singolo), Mngr (manager) o Mngr+ (manager dei manager). | Stringa | IC |
Riservato |
WeeklyBadgeOnsiteDays | Numero medio di giorni alla settimana in cui un dipendente lavora dal sito di lavoro principale dell'azienda. Deve essere un numero compreso tra 0 e 7. WeeklyBadgeOnsiteDays può essere basato sui dati dei badge o su altre origini, ad esempio tag nel sistema hr che mostrano il numero di giorni in cui un dipendente prevede di lavorare in loco. | Double | 4 |
Riservato |
Posizione | Posizione dell'ufficio di un dipendente. | Stringa | Burbank |
Riservato |
CountryOrRegion | Paese o area geografica in cui lavora il dipendente. | Stringa | Japan |
Riservato |
My_Custom_attribute (esempio: Campus) |
Attributo creato | Stringa | West |
N/D (personalizzato)4 |
1. È necessario includere i campi obbligatori. Ogni campo obbligatorio richiede valori non vuoti per ogni riga.
2. Se non si include una colonna EffectiveDate con il caricamento, la data di caricamento diventa l'oggetto EffectiveDate predefinito.
3. Non è necessario includere nessuno di questi campi riservati. Tuttavia, se vengono usate, conservare questi nomi di colonna.
4. Non è necessario includere attributi personalizzati. Se li si aggiunge, tuttavia, non possono avere lo stesso nome di uno degli attributi obbligatori o riservati.
Note sugli attributi e consigli
Alcuni attributi esistono solo per un subset della popolazione
Quando si scelgono gli attributi da includere, alcuni valori di attributo potrebbero essere popolati per un'organizzazione, ma non per altre. Ad esempio, se il caricamento include dati di raggiungimento della quota di vendita che si applicano solo all'organizzazione di vendita, non è possibile usare questi dati per filtrare e raggruppare i dipendenti al di fuori delle vendite.
Troppi valori univoci
A volte un attributo ha troppi valori univoci da usare per il raggruppamento e il filtro. Ad esempio, se una funzione o un codice di processo è definito in modo troppo stretto, potrebbe non fornire una visualizzazione utile del gruppo complessivo. Se un attributo ha centinaia di valori univoci che generano un piccolo gruppo di popolamento per valore, l'attributo potrebbe non essere utile.
Troppi pochi valori univoci
Al contrario, a volte un attributo è troppo definito per un filtro utile. Ad esempio, se l'organizzazione risiede interamente nel Stati Uniti e i record HR per dipendente contengono un codice paese sempre uguale agli Stati Uniti, tale attributo non sarebbe utile.
Attributi ridondanti
Alcuni attributi potrebbero rappresentare gli stessi dati e fornire dati ridondanti non necessari per l'analisi. Ad esempio, i dati delle risorse umane possono contenere sia un ID centro di costo che un nome del centro di costo per un dipendente. Poiché entrambi rappresentano le stesse informazioni in un formato leggermente diverso, includere solo quello con il nome più "user friendly".
Dati line-of-business
A differenza dei dati hr, per i dati line-of-business potrebbe non essere necessario includere ogni persona nell'azienda come parte del caricamento dei dati. Conoscere gli scenari da analizzare ti aiuterà a decidere. Si supponga, ad esempio, di voler confrontare i modelli di collaborazione tra i dipendenti dell'organizzazione sales che hanno un coinvolgimento elevato rispetto a quelli con basso coinvolgimento. Anche se si vogliono i dati delle risorse umane per tutti i dipendenti in modo da poter caratterizzare modelli di collaborazione più ampi, sono necessari solo i dati del punteggio di engagement per i dipendenti dell'organizzazione sales, perché si usano i valori di punteggio per raggruppare e filtrare output di report specifici.