Pianificare la distribuzione di produzione CycleCloud

Distribuzione di Azure CycleCloud

Avviso

Assicurarsi che "Abilita spazio dei nomi gerarchico" per Azure Data Lake Storage Gen 2 non sia impostato durante la creazione dell'account di archiviazione. CycleCloud non è in grado di usare l'archiviazione BLOB con ADLS Gen 2 abilitato come Locker di archiviazione.

Configurazione di Azure CycleCloud

Configurazione del cluster Azure CycleCloud

  • Definire l'accesso utente ai cluster Cluster User Management
  • Determinare quale utilità di pianificazione verrà usata
  • Determinare quale SKU sarà necessario per l'utilità di pianificazione/nodo head
  • Determinare gli SKU necessari per i nodi di calcolo/esecuzione. Questa operazione dipenderà interamente dall'esecuzione dell'applicazione
  • I cluster verranno distribuiti usando un modello o manualmente?
  • Sarà necessario eseguire gli script nell'utilità di pianificazione o eseguire nodi dopo la distribuzione:

Applicazioni

  • Quali dipendenze (librerie e così via) hanno le applicazioni? In che modo saranno resi disponibili?
  • Quanto tempo richiede l'installazione e l'installazione di un'applicazione? Ciò può determinare come un'applicazione viene resa disponibile per i nodi di esecuzione e potrebbe richiedere un'immagine personalizzata.
  • Sono presenti dipendenze di licenza che devono essere prese in considerazione? L'applicazione deve contattare un server licenze locale?
  • Determinare da dove verranno eseguite le applicazioni, ciò dipenderà dai tempi di installazione e dai requisiti di prestazioni:
  • È presente uno SKU di macchina virtuale specifico che dovrà essere usato per l'esecuzione delle applicazioni? MPI sarà un requisito in quanto richiederebbe una famiglia diversa di computer come la serie H?
  • Qual è il numero ottimale di core per ogni processo per ogni applicazione?
  • È possibile individuare le macchine virtuali? Uso di macchine virtuali spot in CycleCloud
  • Assicurarsi che le quote di sottoscrizione siano applicate per soddisfare i requisiti di base per le applicazioni

Dati

  • Determinare dove risiederanno i dati di input in Azure. Ciò dipenderà dalle prestazioni delle applicazioni e delle dimensioni dei dati.
    • Localmente nei nodi di esecuzione
    • Da una condivisione NFS
    • Nell'archivio BLOB
    • Uso di Azure NetApp Files
  • Determinare se è necessaria una post-elaborazione sui dati di output
  • Decidere dove risiederanno i dati di output al termine dell'elaborazione
  • Deve essere copiato altrove?
  • Quali requisiti di archiviazione/backup sono previsti?

Invio di processi

  • In che modo gli utenti inviano processi?
  • Avrà uno script da eseguire nella macchina virtuale dell'utilità di pianificazione o sarà disponibile un front-end per facilitare il caricamento dei dati e l'invio di processi?

Backup e ripristino di emergenza

  • I modelli verranno usati per la creazione del cluster? In questo modo la ricreazione di un server CycleCloud sarà molto più veloce e coerente tra le distribuzioni
  • Quali requisiti sono disponibili per il ripristino di emergenza? Cosa accadrebbe all'azienda se un'area di Azure non fosse disponibile come previsto?
  • Esistono contratti di servizio dell'applicazione definiti dall'azienda interna?
  • È possibile usare un'altra area come standby?
  • I processi sono a esecuzione prolungata? Il checkpoint può essere utile?