Migración a Data Factory en Microsoft Fabric

Data Factory en Microsoft Fabric reúne a Power Query y Azure Data Factory en una experiencia moderna de integración de datos de confianza que permite a los profesionales empresariales y de datos extraer, cargar y transformar datos para su organización. Además, las eficaces funcionalidades de orquestación de datos permiten crear flujos de trabajo de datos simples o complejos que orquestan los pasos necesarios para sus necesidades de integración de datos.

Conceptos clave en Data Factory en Microsoft Fabric

  • Obtención de datos y transformación: Flujo de datos Gen2 es una evolución de los flujos de datos en Power BI. Flujo de datos Gen2 se ha rediseñado para usar motores de proceso de Fabric para el procesamiento y la transformación de datos. Esto les permite ingerir y transformar datos a cualquier escala.

  • Orquestación de datos: al usar canalizaciones de datos con las que los usuarios de Azure Data Factory (ADF) ya están familiarizados, Microsoft Fabric habilita las mismas funcionalidades de orquestación que se ofrecen en ADF. Como parte de la versión de disponibilidad general de Fabric, las canalizaciones de datos admiten la mayoría de las actividades disponibles en ADF.

    Consulte esta lista de actividades que forman parte de las canalizaciones de datos en Fabric.

  • Movimiento de datos preparado para la empresa: ya sea un pequeño movimiento de datos o uno a escala de petabytes, Data Factory proporciona una plataforma de movimiento de datos sin servidor e inteligente que permite mover datos entre diversos orígenes y destinos de datos de forma confiable. Con compatibilidad con más de 170 conectores, Data Factory en Microsoft Fabric permite mover datos entre nubes múltiples, orígenes de datos locales y dentro de redes virtuales (VNet). La optimización inteligente del rendimiento permite a la plataforma de movimiento de datos detectar automáticamente el tamaño del proceso necesario para el movimiento de datos.

Migración desde Azure Data Factory (ADF)

Para permitir que los clientes actualicen a Microsoft Fabric desde Azure Data Factory (ADF), se admiten las siguientes características:

  • Actividades de canalización de datos: se admiten la mayoría de las actividades que ya usa en ADF para Data Factory en Fabric. Además, hemos agregado nuevas actividades para las notificaciones, como, por ejemplo, actividades de Teams y Outlook. Consulte esta lista de actividades que están disponibles en Data Factory en Fabric.

  • Conector OneLake/Lakehouse en Azure Data Factory: para muchos clientes de ADF, ahora puede realizar la integración con Microsoft Fabric e incorporar datos a Fabric OneLake.

  • Flujo de datos de asignación de Azure Data Factory para Fabric: proporcionamos esta guía para clientes de ADF en la que se considera la posibilidad de crear nuevas transformaciones de datos en Fabric.

    Además, para los clientes que consideren la posibilidad de migrar sus flujos de datos de asignación de ADF a Fabric, puede aplicar código de ejemplo del equipo de asesoramiento al cliente de Fabric (Fabric CAT) para convertir los flujos de datos de asignación en código de Spark. Encuentre más información en Asignación de flujos de datos a Microsoft Fabric.

Como parte de la hoja de ruta de Data Factory en Microsoft Fabric, trabajamos para conseguir la versión preliminar de lo siguiente en el segundo trimestre de 2024:

  • Montaje de ADF en Fabric: esta característica permitirá a los clientes montar su ADF existente en Microsoft Fabric. Todas las canalizaciones de ADF funcionarán tal cual y seguirán ejecutándose en Azure, a la vez que le permiten explorar Fabric y definir un plan de actualización más completo.
  • Actualización de canalizaciones de ADF a Fabric: trabajamos con los clientes y la comunidad para obtener información sobre cuál es la mejor manera de admitir actualizaciones de canalizaciones de datos de ADF a Fabric. Como parte de esto, proporcionaremos una experiencia de actualización que le permitirá probar las canalizaciones de datos existentes en Fabric mediante el montaje y la actualización de las mismas.

Migración de Flujo de datos Gen1 de Power BI a Flujo de datos Gen2 en Fabric

Flujo de datos Gen2 en Fabric proporciona muchas ventajas y nuevas funcionalidades en comparación con los flujos de datos (Gen1) en Power BI:

  • Obtención de datos a gran escala ("Fast Copy")
  • Transformaciones de datos a gran escala (mediante el motor de SQL de Fabric Lakehouse)
  • Más destinos de salida: base de datos de Azure SQL, Lakehouse, Warehouse, SharePoint, bases de datos KQL, etc.
  • Experiencia de supervisión e historial de actualizaciones mejorados
  • Experiencias de creación y publicación mejoradas.

Animamos a los clientes a empezar a probar Flujo de datos Gen2, ya sea para volver a crear escenarios de Flujo de datos Gen1 existentes o para probar otros nuevos. Los primeros comentarios sobre Flujo de datos Gen2 nos ayudarán a desarrollar y consolidar las funcionalidades del producto.

Tenemos algunas opciones para que los clientes vuelvan a crear los flujos de datos Gen1 como Flujo de datos Gen2:

  • Exportar consultas de Flujo de datos Gen1 e importarlas en Flujo de datos Gen2: ahora puede exportar consultas en las experiencias de creación de Flujo de datos Gen1 y Gen2 y guardarlas en archivos PQT que puede importar en Flujo de datos Gen2. Para obtener más información, consulte Uso de la característica de plantilla de exportación.
  • Copiar y pegar en Power Query: si tiene un flujo de datos en Power BI o Power Apps, puede copiar las consultas y pegarlas en la experiencia de edición del artefacto de Flujo de datos Gen2. Esta funcionalidad le permite migrar el flujo de datos a Gen2 sin tener que volver a escribir las consultas. Para obtener más información, consulte Copiar y pegar consultas existentes de flujos de datos (Gen1).

Consulte también el siguiente artículo para obtener más información: Diferencias entre Flujo de datos Gen1 y Gen2