¿Qué es un área de trabajo de Azure Machine Learning?

Las áreas de trabajo son lugares para colaborar con compañeros para crear artefactos de aprendizaje automático y trabajo relacionado con grupos. Por ejemplo: experimentos, trabajos, conjuntos de datos, modelos, componentes y puntos de conexión de inferencia. En este artículo se describen las áreas de trabajo, cómo administrar el acceso a ellas y cómo usarlas para organizar el trabajo.

¿Ya está listo para comenzar? Creación de un área de trabajo.

Tareas realizadas en un área de trabajo

En el caso de los equipos de aprendizaje automático, el área de trabajo supone un lugar para organizar su trabajo. Estas son algunas de las tareas que puede iniciar desde un área de trabajo:

  • Crear trabajos: los trabajos son ejecuciones de entrenamiento que utilizas para crear los modelos. Puedes agrupar trabajos en experimentos para comparar métricas.
  • Las canalizaciones de autor: las canalizaciones son flujos de trabajo reutilizables para entrenar y volver a entrenar el modelo.
  • Registrar activos de datos: los activos de datos ayudan en la gestión de los datos que utiliza para la formación de modelos y la creación de canalizaciones.
  • Registrar modelos: una vez que tengas un modelo que quieras implementar, crea un modelo registrado.

Además de agrupar los resultados de aprendizaje automático, las áreas de trabajo también albergan configuraciones de recursos:

Organizar áreas de trabajo

Para los jefes de equipo y administradores de aprendizaje automático, las áreas de trabajo sirven como contenedores para la administración del acceso, la administración de costes y el aislamiento de datos. Estos son algunos consejos para organizar las áreas de trabajo:

  • Use roles de usuario para la administración de permisos en el área de trabajo entre usuarios. Por ejemplo, un científico de datos, un ingeniero de aprendizaje automático o un administrador.
  • Asigne acceso a grupos de usuarios: al usar grupos de usuarios de Microsoft Entra, no tiene que agregar usuarios individuales a cada área de trabajo ni a otros recursos a los que el mismo grupo de usuarios requiere acceso.
  • Creación de un área de trabajo por proyecto: aunque se puede usar un área de trabajo para varios proyectos, limitarlo a un proyecto por área de trabajo permite la generación de informes de costos acumulados a un nivel de proyecto. También permite administrar configuraciones como almacenes de datos en el ámbito de cada proyecto.
  • Compartir recursos de Azure: las áreas de trabajo requieren que cree varios recursos asociados. Comparta estos recursos entre áreas de trabajo para guardar pasos de configuración repetitivos.
  • Habilite el autoservicio: cree previamente y proteja los recursos asociados como administrador de TI y utilice roles de usuario para que los científicos de datos puedan crear áreas de trabajo por su cuenta.
  • Compartir recursos: puede compartir recursos entre áreas de trabajo mediante registros de Azure Machine Learning.

¿Cómo se almacena mi contenido en un área de trabajo?

Su espacio de trabajo mantiene un historial de todas las ejecuciones de capacitación, con registros, métricas, resultados, metadatos de linaje y una instantánea de sus scripts. A medida que realice tareas en Azure Machine Learning, se generarán artefactos. Sus metadatos y datos se almacenan en el área de trabajo y en sus recursos asociados.

Recursos asociados

Cuando creas una nueva área de trabajo, debes traer otros recursos de Azure para almacenar los datos. Si usted no proporciona estos recursos, Azure Machine Learning los creará de forma automática.

  • Cuenta de Azure Storage. Almacena artefactos de aprendizaje automático, como registros de trabajos. De forma predeterminada, esta cuenta de almacenamiento se usa cuando cargas datos en el área de trabajo. Las instancias de Jupyter Notebook que se usan con las instancias de proceso de Azure Machine Learning también se almacenan aquí.

    Importante

    No se puede utilizar una cuenta Azure Storage existente si es:

    • Una cuenta de tipo BlobStorage
    • Una cuenta Premium (Premium_LRS y Premium_GRS)
    • Una cuenta con espacio de nombres jerárquico (utilizado con Azure Data Lake Storage Gen2).

    Puedes usar Premium Storage o espacio de nombres jerárquico como almacenamiento adicional mediante la creación de un almacén de datos.

    No habilite el espacio de nombres jerárquico en la cuenta de almacenamiento después de actualizar a la versión v2 de uso general.

    Si traes una cuenta de almacenamiento de uso general v1 existente, puedes actualizarla a uso general v2 después de crear el área de trabajo.

  • Azure Container Registry (ACR). Almacena contenedores docker creados cuando crea entornos personalizados a través de Azure Machine Learning. La implementación de modelos AutoML y perfiles de datos también activará la creación de entornos personalizados.

    Las áreas de trabajo pueden crearse sin ACR como dependencia si no necesita crear contenedores Docker personalizados. Azure Machine Learning puede leer registros de contenedores externos.

    ACR se aprovisionará automáticamente cuando cree imágenes Docker personalizadas. Utilice el control de acceso basado en roles de Azure (Azure RBAC) para impedir que se creen contenedores Docker de clientes.

    Importante

    Si la configuración de su suscripción requiere la adición de etiquetas a los recursos bajo ella, ACR creado por Azure Machine Learning fallará, ya que no podemos establecer etiquetas a ACR.

  • Azure Application Insights. Te ayuda a supervisar y recopilar información de diagnóstico de los puntos de conexión de inferencia.

    Para obtener más información, consulte Supervisión de los puntos de conexión en línea.

  • Azure Key Vault Almacena los secretos que utilizan los objetivos de cálculo y otra información confidencial que necesita el área de trabajo.

Creación de un área de trabajo

Hay varias maneras de crear un área de trabajo. Para empezar, utilice una de las siguientes opciones:

Para automatizar la creación del área de trabajo mediante la configuración de seguridad preferida:

  • Use las API de REST directamente en el entorno de scripting, para la integración de la plataforma o en flujos de trabajo de MLOps.

Herramientas para la interacción y administración del área de trabajo

Una vez configurado el área de trabajo, puedes interactuar con ella de las siguientes maneras:

Las siguientes tareas de administración del área de trabajo están disponibles en cada interfaz.

Tarea de administración de áreas de trabajo Portal Estudio SDK de Python Azure CLI Código de VS
Crear un área de trabajo
Administración del acceso al área de trabajo
Creación y administración de recursos de proceso
Creación de una instancia de proceso

Advertencia

No se admite mover el área de trabajo de Azure Machine Learning a otra suscripción ni mover la suscripción propietaria a un nuevo inquilino. Si lo hace, pueden producirse errores.

Subrecursos

Al crear clústeres de proceso e instancias de proceso en Azure Machine Learning, se crean subrecursos.

  • Máquinas virtuales: proporcionan potencia informática para las instancias de proceso y los clústeres de proceso, que se usan para ejecutar trabajos.
  • Equilibrador de carga: se crea un equilibrador de carga de red para cada instancia de proceso y clúster de proceso, para administrar el tráfico incluso mientras está detenido el clúster o la instancia de proceso.
  • Red virtual: estas redes ayudan a los recursos de Azure a comunicarse entre sí, con Internet y con otras redes locales.
  • Ancho de banda: encapsula todas las transferencias de datos salientes entre regiones.

Pasos siguientes

Para más información sobre cómo planear un área de trabajo para los requisitos de su organización, consulte Organización y configuración de entornos de Azure Machine Learning.

Para una introducción a Azure Machine Learning, consulte: