Exportación e importación de cuadernos de Databricks

En esta página se describe cómo importar y exportar cuadernos en Azure Databricks y los formatos de cuaderno que admite Azure Databricks.

Formatos de cuaderno admitidos

Databricks puede importar y exportar cuadernos en los siguientes formatos:

  • Archivo de código fuente: archivo que contiene solo instrucciones de código fuente con la extensión .scala, .py, .sql o .r.
  • HTML: cuaderno de Azure Databricks con la extensión .html.
  • Archivo .dbc de Databricks.
  • Cuaderno de IPython: cuaderno de Jupyter Notebook con la extensión .ipynb.
  • RMarkdown: documento R Markdown con la extensión .Rmd.

Importación de un cuaderno

Puede importar un cuaderno externo desde una dirección URL o un archivo. También puede importar un archivo ZIP de cuadernos exportados de forma masiva desde un área de trabajo de Azure Databricks.

  1. Haga clic en Workspace Icon Área de trabajo en la barra lateral. Realice una de las siguientes acciones:
    • Haga clic con el botón derecho en una carpeta y seleccione Importar.
    • Para importar un cuaderno en el nivel superior de la carpeta del área de trabajo actual, haga clic en el menú de tres puntos de la esquina superior derecha y seleccione Importar.
  2. Especifique la dirección URL o busque un archivo que contenga un formato externo compatible o un archivo ZIP de cuadernos exportados desde un área de trabajo de Azure Databricks.
  3. Haga clic en Import.
    • Si solo elige un cuaderno, se exportará en la carpeta actual.
    • Si elige un archivo DBC o ZIP, se volverá a crear su estructura de carpetas en la carpeta actual y se importará cada cuaderno.

Importación de un archivo y conversión del archivo en un cuaderno

Puede convertir scripts de Python, SQL, Scala y R en cuadernos de una sola celda agregando un comentario a la primera celda del archivo:

Python

# Databricks notebook source

SQL

-- Databricks notebook source

Scala

// Databricks notebook source

R

# Databricks notebook source

Para definir las celdas de un script, use el comentario especial que se muestra a continuación. Al importar el script a Databricks, las celdas se crean como marcadas por las líneas COMMAND mostradas.

Python

# COMMAND ----------

SQL

-- COMMAND ----------

Scala

// COMMAND ----------

R

# COMMAND ----------

Exportación de cuadernos

Nota:

Si se exporta un cuaderno como HTML, cuaderno de IPython (.ipynb) o archivo (DBC) y no se han borrado las salidas del comando, estas se incluyen en la exportación.

Para exportar un cuaderno, seleccione Archivo > Exportar en la barra de herramientas del cuaderno y seleccione el formato de exportación.

Para exportar todas las carpetas de una carpeta de área de trabajo como archivo ZIP:

  1. Haga clic en Workspace Icon Área de trabajo en la barra lateral.
  2. Haga clic con el botón derecho en la carpeta y seleccione Exportar.
  3. Seleccione el formato de exportación:
    • Archivo DBC: exporta un archivo de Databricks, un formato binario que incluye metadatos y salidas del comando del cuaderno.
    • Archivo de origen: exporta un archivo ZIP de archivos de origen de cuaderno, que se puede importar en un área de trabajo de Azure Databricks, usarse en una canalización de CI/CD o ver como archivos de origen en el idioma predeterminado de cada cuaderno. No se incluyen las salidas del comando del cuaderno.
    • Archivo HTML: exporta un archivo ZIP de archivos HTML. El archivo HTML de cada cuaderno se puede importar en un área de trabajo de Azure Databricks o se puede ver como HTML. Se incluyen las salidas del comando del cuaderno.