¿Qué es Data Factory en Microsoft Fabric?

Data Factory le permite disfrutar de una experiencia de integración de datos moderna para ingerir, preparar y transformar datos de un amplio conjunto de orígenes de datos (por ejemplo, bases de datos, almacenamiento de datos, Lakehouse, datos en tiempo real, etc.). Tanto si es ciudadano como desarrollador profesional, podrá transformar los datos con transformaciones inteligentes y aprovechar un amplio conjunto de actividades. Podemos crear canalizaciones para ejecutar una o varias actividades, acceder a orígenes de datos o servicios a través de servicios vinculados y, después de crear una canalización, podemos agregar desencadenadores para ejecutar automáticamente nuestros procesos en momentos específicos o en respuesta a escenarios cambiantes. Con Data Factory en Microsoft Fabric, incorporamos funcionalidades de copia rápida (movimiento de datos) a flujos de datos y canalizaciones de datos. Con Fast Copy, puede mover los datos entre sus almacenes de datos favoritos que brillan rápidamente. Lo más importante es que Fast Copy le permite traer datos a Lakehouse y al almacén de datos en Microsoft Fabric para análisis.

Hay dos características principales de alto nivel que Data Factory implementa: flujos de datos y canalizaciones.

  • Los flujos de datos permiten aprovechar más de 300 transformaciones en el diseñador de flujos de datos, lo que le permite transformar los datos más fácilmente y con más flexibilidad que cualquier otra herramienta, incluidas las transformaciones de datos basadas en inteligencia artificial inteligente.
  • Las canalizaciones de datos permiten aprovechar las funcionalidades de orquestación de datos enriquecidas de fábrica para crear flujos de trabajo de datos flexibles que satisfagan sus necesidades empresariales.

Flujos de datos

Los flujos de datos proporcionan una interfaz de bajo código para ingerir datos de cientos de orígenes de datos, lo que transforma los datos con más de 300 transformaciones de datos. A continuación, puede cargar los datos resultantes en varios destinos, como Azure SQL bases de datos y mucho más. Los flujos de datos se pueden ejecutar repetidamente mediante la actualización manual o programada, o como parte de una orquestación de canalización de datos.

Los flujos de datos se crean utilizando la experiencia familiar de Power Query que está disponible hoy en día en varios productos y servicios de Microsoft, como Excel, Power BI, Power Platform, aplicaciones Dynamics 365 Insights y más. Power Query permite a todos los usuarios, desde los ciudadanos hasta los integradores de datos profesionales, realizar ingesta de datos y transformaciones de datos en todo su patrimonio de datos. Realice combinaciones, agregaciones, limpieza de datos, transformaciones personalizadas y mucho más desde una interfaz de usuario de código bajo, muy visual y fácil de usar.

Captura de pantalla de la interfaz de usuario de Power BI que muestra la experiencia de flujo de datos.

Canalizaciones de datos

Las canalizaciones de datos permiten eficaces funcionalidades de flujo de trabajo a escala en la nube. Con las canalizaciones de datos, puede crear flujos de trabajo complejos que puedan actualizar el flujo de datos, mover datos de tamaño PB y definir canalizaciones de flujo de control sofisticadas.

Use canalizaciones de datos para crear flujos de trabajo ETL y factoría de datos complejos que pueden realizar muchas tareas diferentes a escala. Las funcionalidades de flujo de control están integradas en canalizaciones de datos que permiten crear lógica de flujo de trabajo, que proporciona bucles y condicionales.

Agregue una actividad de copia controlada por la configuración junto con la actualización del flujo de datos de poco código en una sola canalización para una canalización de datos ETL de un extremo a otro. Incluso puede agregar actividades de código primero para cuadernos de Spark, scripts SQL, procedimientos almacenados, etc.

Captura de pantalla de la interfaz de usuario que muestra la actividad de copia.

Para comenzar con Microsoft Fabric, vaya a Inicio rápido: cree su primer flujo de datos Gen2 para obtener y transformar datos.