Conexión a Labelbox
Labelbox es una plataforma de datos de entrenamiento que se usa para crear datos de entrenamiento a partir de imágenes, vídeo, audio, texto e imágenes en mosaico. Con Labelbox, los equipos de inteligencia artificial pueden personalizar un flujo de trabajo para operar, administrar y mejorar el etiquetado y la catalogación de los datos y la depuración de modelos en una única plataforma unificada. Labelbox está diseñado para ayudar a los equipos de inteligencia artificial a crear y operar sistemas de aprendizaje automático de nivel de producción.
Puede conectar a Labelbox los clústeres de Azure Databricks que tengan la versión para Machine Learning de Databricks Runtime.
Conexión a Labelbox mediante Partner Connect
En esta sección se describe cómo conectar un clúster en el área de trabajo de Azure Databricks a Labelbox mediante Partner Connect.
Diferencias entre las conexiones estándar y Labelbox
Para conectarse a Labelbox mediante Partner Connect, siga los pasos descritos en Conexión a partners de Machine Learning con Partner Connect. La conexión Labelbox se diferencia de las conexiones estándar de aprendizaje automático en los siguientes aspectos:
- Además de un clúster, una entidad de servicio y un token de acceso personal, Partner Connect crea un cuaderno denominado
labelbox_databricks_example.ipynb
en la carpeta Workspace/Shared/labelbox_demo de la cuenta de Labelbox, si aún no existe.
Pasos para establecer la conexión
Para conectarse a Labelbox mediante Partner Connect, haga lo siguiente:
- Conexión a partners de Machine Learning con Partner Connect.
- Cree una clave de API de Labelbox para su cuenta de Labelbox, si no tiene una. Copie la clave de API y guárdela en una ubicación segura, porque la clave se ocultará finalmente y la necesitará más adelante.
- Configuración del clúster de ML y el cuaderno de inicio de Labelbox.
Conexión manual a Labelbox
Los pasos de esta sección describen cómo conectar Labelbox a un clúster de Azure Databricks.
Nota:
Para conectarse más rápido, use Partner Connect.
Requisitos
Debe tener un clúster disponible que ejecute Databricks Runtime para Machine Learning. Para comprobar esto en un clúster, busque ML en la columna Runtime (Entorno de ejecución) cuando muestre el clúster en el área de trabajo. Si no tiene un clúster de Databricks Runtime ML disponible, cree un clúster y para Databricks Runtime Version (Versión de Databricks Runtime), elija una versión en la lista de ML.
Pasos para establecer la conexión
Para conectarse a Labelbox manualmente, siga los pasos que se muestran a continuación:
- Vaya a la página Labelbox para suscribirse (Sign Up) a una nueva cuenta de Labelbox o iniciar sesión (Log In) en su cuenta actual de Labelbox.
- Cree una clave de API de Labelbox para su cuenta de Labelbox, si no tiene una. Copie la clave de API y guárdela en una ubicación segura, porque la clave se ocultará finalmente y la necesitará más adelante.
- Compruebe si hay un cuaderno de inicio de Labelbox en el área de trabajo:
- En la barra lateral, haga clic en Workspace > Shared (Área de trabajo > Compartida).
- Si aún no hay una carpeta denominada labelbox_demo, créela: i. Haga clic en la flecha abajo situada junto a Shared (Compartida).
ii. Haga clic en Create > Folder (Crear > Carpeta).
iii. Escriba
labelbox_demo
. iv. Haga clic en Create Folder (Crear carpeta). - Haga clic en la carpeta labelbox_demo. Si no hay ningún cuaderno de inicio denominado labelbox_databricks_example.ipynb en la carpeta, impórtelo: i. Haga clic en la flecha abajo situada junto a labelbox_demo.
ii. Haga clic en Import.
iii. Haga clic en URL.
iv. Escriba
https://github.com/Labelbox/labelbox-python/blob/develop/examples/integrations/databricks/labelbox_databricks_example.ipynb
y haga clic en Importar.
- Continúe para configurar el clúster de ML y el cuaderno de inicio de Labelbox.
Configuración del clúster de ML y el cuaderno de inicio de Labelbox
- Compruebe que las bibliotecas de Labelbox necesarias están instaladas en el clúster de ML:
Haga clic en Compute (Proceso) en la barra lateral.
Haga clic en el clúster de ML. Use el cuadro Filter (Filtro) para buscarlo, si es necesario.
Nota:
Si usó Partner Connect para conectarse a Labelbox, el nombre del clúster de ML debería ser LABELBOX_CLUSTER.
Haga clic en la pestaña Bibliotecas.
Si no aparece el paquete labelbox, instálelo: i. Haga clic en Install New (Instalar nuevo). ii. Haga clic en PyPI. iii. En Package (Paquete), escriba labelbox. iv. Haga clic en Instalar.
Si no aparece el paquete labelspark, instálelo: i. Haga clic en Install New (Instalar nuevo). ii. Haga clic en PyPI. iii. En Package (Paquete), escriba labelspark. iv. Haga clic en Instalar.
- Conecte el clúster de ML al cuaderno de inicio:
- En la barra lateral, haga clic en Workspace > Shared > labelbox_demo > labelbox_databricks_example.ipynb.
- Conecte el clúster de ML al cuaderno.
- Examine el cuaderno para saber cómo automatizar Labelbox.
Recursos adicionales
- Léame en GitHub del cuaderno de principiantes
- Documentos de Labelbox
- Soporte técnico