Lección 1: Creación de un proyecto y un paquete básico con SQL Server Integration Services (SSIS)

Se aplica a: SQL Server SSIS Integration Runtime en Azure Data Factory

En esta lección, creará un paquete simple de extracción, transformación y carga (ETL). El paquete extrae datos extrae datos de un único origen de archivo plano, los transforma mediante dos componentes de transformación de búsqueda y escribe los datos transformados en una copia de la tabla de hechos FactCurrencyRate de la base de datos de muestra AdventureWorksDW2022. Como parte de esta lección, aprenderá a crear paquetes, agregar y configurar orígenes de datos y conexiones de destino, y trabajar con nuevos componentes de flujo de control y flujo de datos.

Antes de crear un paquete, debe entender el formato que se usa en los datos de origen y de destino. Después, estará listo para definir las transformaciones necesarias para asignar los datos de origen al destino.

Requisitos previos

Este tutorial se basa en Microsoft SQL Server Data Tools, un conjunto de paquetes de ejemplo y una base de datos de ejemplo.

Examen de los datos de origen

En este tutorial, los datos de origen son un conjunto de datos de moneda históricos que se encuentra en un archivo plano denominado SampleCurrencyData.txt. Los datos de origen tienen las cuatro columnas siguientes: tipo de cambio medio de la moneda, una clave de moneda, una clave de fecha y el tipo de cambio de final del día.

Este es un ejemplo de los datos de origen del archivo SampleCurrencyData.txt:

1.00070049USD9/3/05 0:001.001201442
1.00020004USD9/4/05 0:001
1.00020004USD9/5/05 0:001.001201442
1.00020004USD9/6/05 0:001
1.00020004USD9/7/05 0:001.00070049
1.00070049USD9/8/05 0:000.99980004
1.00070049USD9/9/05 0:001.001502253
1.00070049USD9/10/05 0:000.99990001
1.00020004USD9/11/05 0:001.001101211
1.00020004USD9/12/05 0:000.99970009

Cuando se trabaja con datos de origen de un archivo plano, es importante entender el modo en el que el administrador de conexiones de archivos planos interpreta los datos del archivo plano. Si el origen de archivo plano es Unicode, el administrador de conexiones de archivos planos define todas las columnas como [DT_WSTR], con un ancho de columna predeterminado de 50. Si el origen de archivo plano tiene la codificación ANSI, las columnas se definen como [DT_STR], con un ancho de columna predeterminado de 50. Es probable que tenga que cambiar estos valores predeterminados para que los tipos de columna de cadena sean más adecuados para los datos. Debe examinar el tipo de datos de destino y, después, elegir ese tipo en el Administrador de conexiones de archivos planos.

Examen de los datos de destino

El destino de los datos de origen es una copia de la tabla de hechos FactCurrencyRate de AdventureWorksDW2022. La tabla de hechos FactCurrencyRate tiene cuatro columnas y tiene relaciones con dos tablas de dimensiones, como se muestra en la tabla siguiente.

Nombre de columna Tipo de datos Tabla de búsqueda columna de búsqueda
AverageRate float None None
CurrencyKey int (FK) DimCurrency CurrencyKey (PK)
DateKey int (FK) DimDate DateKey (PK)
EndOfDayRate float None None

Asignación de los datos de origen al destino

El análisis de los formatos de datos de origen y de destino indica que se necesitan búsquedas para los valores CurrencyKey y DateKey. Las transformaciones que realizan estas búsquedas obtienen esos valores mediante las claves alternativas de las tablas de dimensiones DimCurrency y DimDate.

Columna de archivo plano Nombre de la tabla Nombre de columna Tipo de datos
0 FactCurrencyRate AverageRate float
1 DimCurrency CurrencyAlternateKey nchar(3)
2 DimDate FullDateAlternateKey date
3 FactCurrencyRate EndOfDayRate float

Tareas de la lección

Esta lección contiene las siguientes tareas:

Iniciar la lección

Paso 1: Creación de un proyecto de Integration Services