Ciclo di vita del processo di data science per i team
Il processo di data science per i team (TDSP) fornisce un ciclo di vita che il team può usare per strutturare i progetti di data science. Il ciclo di vita descrive i passaggi che è possibile eseguire per completare correttamente un progetto.
È consigliabile usare questo ciclo di vita se si dispone di un progetto di data science che fa parte di un'applicazione intelligente. Le applicazioni intelligenti distribuiscono modelli di Machine Learning o intelligenza artificiale per analitica predittivi. È anche possibile usare questo processo per progetti esplorativi di data science e progetti improvvisati analitica, ma potrebbe non essere necessario implementare ogni passaggio del ciclo di vita.
Il team può combinare il TDSP basato su attività con altri cicli di vita di data science, ad esempio il processo standard cross-industry per il data mining (CRISP-DM), il processo di individuazione delle informazioni nei database (KDD) o il processo personalizzato dell'organizzazione.
Scopo e credibilità
Lo scopo di TDSP è semplificare e standardizzare l'approccio ai progetti di data science e intelligenza artificiale. Microsoft ha applicato questa metodologia strutturata in centinaia di progetti. I ricercatori hanno studiato TDSP e pubblicato i loro risultati nella letteratura peer-reviewed. Il framework architettonico del TDSP è testato e dimostrato accuratamente efficace in molte aree.
Cinque fasi del ciclo di vita
Il ciclo di vita del TDSP è costituito da cinque fasi principali eseguite dal team in modo iterativo. Queste fasi includono:
- Comprensione del business
- Acquisizione e comprensione dei dati
- Modellazione
- Distribuzione
- Accettazione del cliente
Ecco una rappresentazione visiva del ciclo di vita di TDSP:
Il ciclo di vita di TDSP è una sequenza di passaggi che forniscono indicazioni per la creazione di modelli predittivi. Il team distribuisce i modelli predittivi in un ambiente di produzione che si prevede di usare per creare applicazioni intelligenti. L'obiettivo di questo ciclo di vita del processo è spostarsi in un progetto di data science verso un endpoint di engagement chiaro. Con data science si intente un esercizio nell'ambito della ricerca e dell'individuazione. Quando si usa un processo ben definito per comunicare le attività al team, si aumenta la possibilità di eseguire correttamente un progetto di data science.
Ogni fase ha un proprio articolo che descrive:
- Obiettivi: obiettivi della fase.
- Procedura: una descrizione delle attività eseguite nella fase e indicazioni su come completarle.
- Artefatti: risultati finali che è necessario produrre durante la fase e le risorse che è possibile usare per crearli.
Citazioni con peer reviewing
I ricercatori pubblicano letteratura peer-reviewed sul TDSP. Esaminare il materiale seguente per esaminare le funzionalità e le applicazioni TDSP.
Ingegneria software per Machine Learning: case study (pagine 291-300)
Ciclo di vita dell'intelligenza artificiale: dalla concezione alla produzione
Gestione degli artefatti del ciclo di vita di Machine Learning: sondaggio (pagine 18-35)
Costruzione di un modello di qualità per i sistemi di Machine Learning (pagine 307-335)
Collaboratori
Questo articolo viene gestito da Microsoft. Originariamente è stato scritto dai seguenti contributori.
Autore principale:
- Mark Tabladillo | Senior Cloud Solution Architect
Per visualizzare i profili LinkedIn non pubblici, accedere a LinkedIn.
Risorse correlate
- Per la prima fase del ciclo di vita, vedere Business Understanding.
- Che cos'è il processo di data science per i team?
- Confrontare prodotti e tecnologie di Machine Learning