Planear la implementación de producción de CycleCloud

Implementación de Azure CycleCloud

Advertencia

Asegúrese de que "Habilitar el espacio de nombres jerárquico" para Azure Data Lake Storage Gen 2 no está establecido durante la creación de la cuenta de almacenamiento. CycleCloud no puede usar Blob Storage con ADLS Gen 2 habilitado como una caja de seguridad de almacenamiento.

Configuración de Azure CycleCloud

Configuración del clúster de Azure CycleCloud

  • Definición del acceso de usuario a los clústeres Administración de usuarios del clúster
  • Determinar qué programador se usará
  • Determinar qué SKU será necesaria para el programador o el nodo principal
  • Determine qué SKU serán necesarias para los nodos de proceso y ejecución. Esto dependerá completamente de la ejecución de la aplicación.
  • ¿Se implementarán clústeres mediante una plantilla o manualmente?
  • Los scripts deben ejecutarse en el programador o ejecutar nodos una vez implementados:

APLICACIONES

  • ¿Qué dependencias (bibliotecas, etc.) tienen las aplicaciones? ¿Cómo estarán disponibles?
  • ¿Cuánto tiempo tarda una aplicación en configurar e instalar? Esto puede determinar cómo una aplicación está disponible para los nodos de ejecución y podría requerir una imagen personalizada.
  • ¿Hay alguna dependencia de licencia que tenga en cuenta? ¿La aplicación necesita ponerse en contacto con un servidor de licencias local?
  • Determine dónde se ejecutarán las aplicaciones, dependerá de los tiempos de instalación y los requisitos de rendimiento:
  • ¿Hay una SKU de máquina virtual específica en la que se debe usar para que las aplicaciones se ejecuten? ¿MPI será un requisito, ya que requeriría una familia diferente de máquinas como la serie H?
  • ¿Cuál será el número óptimo de núcleos por trabajo para cada aplicación?
  • ¿Se pueden usar máquinas virtuales de spot? Uso de máquinas virtuales de spot en CycleCloud
  • Asegúrese de que las cuotas de suscripción están en vigor para cumplir los requisitos básicos de las aplicaciones.

Datos

  • Determine dónde residirán los datos de entrada en Azure. Esto dependerá del rendimiento de las aplicaciones y el tamaño de los datos.
    • Localmente en los nodos de ejecución
    • Desde un recurso compartido NFS
    • En Blob Storage
    • Uso de Azure NetApp Files
  • Determinar si hay algún procesamiento posterior necesario en los datos de salida
  • Decidir dónde residirán los datos de salida una vez completado el procesamiento
  • ¿Necesita copiarse en otro lugar?
  • ¿Qué requisitos de archivo o copia de seguridad hay?

Envío de trabajos

  • ¿Cómo enviarán los usuarios trabajos?
  • ¿Tendrán un script para ejecutarse en la máquina virtual del programador o habrá un front-end para ayudar con la carga de datos y el envío del trabajo?

Copia de seguridad y recuperación ante desastres

  • ¿Se usarán plantillas para la creación de clústeres? Esto hará que la recreación de un servidor CycleCloud sea mucho más rápida y coherente en las implementaciones.
  • ¿Qué requisitos hay para la recuperación ante desastres? ¿Qué pasaría con la empresa si una región de Azure no estuviera disponible según lo previsto?
  • ¿Hay acuerdos de nivel de servicio de aplicación definidos por el negocio interno?
  • ¿Podría usarse otra región como espera?
  • ¿Son trabajos de larga duración? ¿Sería beneficioso el control de puntos de control?