Conoscere il problema aziendale
Si lavora presso Proseware, una giovane startup, che mira a migliorare l'assistenza sanitaria. Insieme al team di data science, di recente è stato completato un lavoro per rendere operativo un modello di classificazione del diabete. In altre parole, sono stati convertiti i notebook in script che è possibile eseguire come processo di Azure Machine Learning.
Durante una presentazione della soluzione end-to-end agli stakeholder aziendali e tecnici di Proseware, sono emerse diverse domande su come ridimensionare l'uso di questo modello sia dal punto di vista della creazione del modello che dal punto di vista del consumo.
Nell'assistenza sanitaria, molti modelli usano i dati medici dei pazienti per prevedere le malattie. Dai progetti precedenti si è appreso che questi modelli dipendono spesso dalla posizione geografica della popolazione su cui viene eseguito il training del modello. Per rendere scalabile questo modello, è necessario assicurarsi che sia possibile eseguire automaticamente il training di versioni diverse del modello in base a segmenti di dati diversi.
Durante la riunione, gli stakeholder aziendali e tecnici hanno deciso di implementare una strategia di operazioni per l'apprendimento automatico (MLOps) per consentire la creazione, l'aggiornamento e la distribuzione rapidi di modelli come il modello di classificazione che il team di data science ha sviluppato per l'app Web del professionista.
Poiché Proseware usa GitHub per il controllo della versione del codice, è stata presa la decisione di usare GitHub Actions come componente di automazione della strategia MLOps.
Il primo passaggio per implementare il processo di automazione consiste nello sviluppare un'azione GitHub per eseguire il training del modello di classificazione del diabete usando i processi di Azure Machine Learning.
Per creare l'azione GitHub per attivare il training del modello usando l'ambiente di calcolo di Azure Machine Learning, è necessario:
- Creare un'entità servizio usando l'interfaccia della riga di comando di Azure.
- Archiviare le credenziali dell'entità servizio come segreto in GitHub.
- Creare un'azione GitHub per eseguire il training del modello usando l'ambiente di calcolo di Azure Machine Learning.