Conoscere il problema aziendale

Completato

Si supponga di essere un tecnico di Machine Learning presso Proseware, una giovane startup che sta lavorando a una nuova app in campo medico. Il modello di classificazione del diabete creato dagli scienziati dei dati è il primo modello da integrare nell'app. Dopo aver parlato con il team allargato, si scopre che l'obiettivo è quello di integrare più modelli nell'app Web.

Dopo aver verificato la validità del modello di classificazione del diabete, Proseware vuole aggiungere altri modelli di Machine Learning, in modo che i medici possano diagnosticare più velocemente varie malattie per i pazienti. Per ogni nuovo modello, il team di data science dovrà essere in grado di sperimentarlo in un ambiente sicuro. Quando il nuovo modello risulta essere sufficientemente accurato da essere integrato nell'app Web, dovrà essere testato prima di distribuirlo in un endpoint che verrà chiamato dall'app Web.

Insieme al team, si decide che è preferibile usare ambienti diversi:

  • Sviluppo per la sperimentazione.
  • Staging per i test.
  • Produzione per la distribuzione del modello nell'endpoint di produzione.

Per ogni ambiente si creerà un'area di lavoro di Azure Machine Learning separata. Mantenendo separate le aree di lavoro per ogni ambiente, sarà possibile proteggere i dati e le risorse. Ad esempio, l'area di lavoro di sviluppo non contiene dati personali dai pazienti. Gli scienziati dei dati avranno accesso solo all'area di lavoro di sviluppo, perché necessitano solo di un ambiente per la sperimentazione e non devono accedere a codice o risorse di produzione.

Come tecnico di Machine Learning, è necessario assicurarsi che qualsiasi modello creato dagli scienziati dei dati possa essere spostato facilmente negli altri ambienti. Quando il nuovo modello è pronto per la distribuzione, si vuole che il modello venga sottoposto a training e testato nell'ambiente di staging. Dopo aver testato il codice, il modello e la distribuzione, si vuole distribuire il modello nell'ambiente di produzione. Parti di questo processo possono essere automatizzate per velocizzare il processo.

Per usare gli ambienti, sarà necessario:

  • Creare gli ambienti nel repository GitHub.
  • Archiviare le credenziali in ogni area di lavoro di Azure Machine Learning come segreto dell'ambiente in GitHub.
  • Aggiungere revisori obbligatori agli ambienti per l'approvazione controllata.
  • Usare gli ambienti nei flussi di lavoro di GitHub Actions.