Lição 1: Criar um projeto e pacote básico com oSQL Server Integration Services (SSIS)
Aplica-se a: SQL Server SSIS Integration Runtime no Azure Data Factory
Nessa lição, você criará um pacote simples de extração, transformação e carregamento (ETL). O pacote extrai dados de uma fonte única de arquivo simples, transforma os dados usando duas transformações de pesquisa e grava os dados transformados em uma cópia da tabela de fatos FactCurrencyRate no banco de dados de exemplo AdventureWorksDW2022
. Como parte dessa lição, você aprende a criar novos pacotes, adicionar e configurar conexões de destino e de fonte de dados e trabalhar com novos fluxos de controle e componentes de fluxo.
Antes de criar um pacote, você precisa ter um bom conhecimento da formatação usada nos dados de origem e de destino. Em seguida, você estará pronto para definir as transformações necessárias para mapear os dados de origem para o destino.
Pré-requisitos
Este tutorial se baseia no Microsoft SQL Server Data Tools, um conjunto de pacotes de exemplo e um banco de dados de exemplo.
Para instalar SQL Server Data Tools, confira Baixar SQL Server Data Tools.
Para baixar todos os pacotes de lição para este tutorial:
Navegue até Arquivos do tutorial do Integration Services.
Selecione o botão DOWNLOAD.
Selecione o arquivo Creating a Simple ETL Package.zip e, em seguida, selecione Avançar.
Depois que o arquivo for baixado, descompacte o conteúdo para um diretório local.
Para instalar e implantar o banco de dados de exemplo
AdventureWorksDW2022
, confira Instalar e configurar o banco de dados de exemplo AdventureWorks – SQL.
Examinar os dados de origem
Nesse tutorial, os dados de origem são um conjunto de dados de moeda corrente históricos em arquivo simples chamado SampleCurrencyData.txt. A fonte de dados tem as seguintes quatro colunas: a taxa média de moeda, uma chave de moeda, uma chave de data e a taxa de final do dia.
Aqui está um exemplo dos dados de origem no arquivo SampleCurrencyData.txt:
1.00070049USD9/3/05 0:001.001201442
1.00020004USD9/4/05 0:001
1.00020004USD9/5/05 0:001.001201442
1.00020004USD9/6/05 0:001
1.00020004USD9/7/05 0:001.00070049
1.00070049USD9/8/05 0:000.99980004
1.00070049USD9/9/05 0:001.001502253
1.00070049USD9/10/05 0:000.99990001
1.00020004USD9/11/05 0:001.001101211
1.00020004USD9/12/05 0:000.99970009
Quando estiver trabalhando com os dados de origem de arquivo simples, é importante entender como o gerenciador de conexões de Arquivo Simples interpreta os dados de arquivo simples. Se a fonte do arquivo simples for Unicode, o gerenciador de conexões de Arquivo Simples definirá todas as colunas como [DT_WSTR] com uma largura padrão de coluna de 50. Se a fonte de arquivo simples for codificada por ANSI, as colunas estarão definidas como [DT_STR] com uma largura de coluna padrão de 50. Você provavelmente precisará alterar esses padrões para tornar os tipos de coluna de cadeia de caracteres mais aplicáveis para seus dados. Você precisará examinar o tipo de dados de destino e, em seguida, escolher o tipo dentro do Gerenciador de conexão de Arquivo Simples.
Examinar os dados de destino
O destino dos dados de origem é uma cópia da tabela de fatos FactCurrencyRate no AdventureWorksDW2022
. A tabela de fatos FactCurrencyRate tem quatro colunas e tem relações com duas tabelas dimensionais, como mostrado na tabela a seguir.
Nome da coluna | Tipo de Dados | Tabela de pesquisa | coluna de pesquisa |
---|---|---|---|
AverageRate |
float |
Nenhum | Nenhum |
CurrencyKey |
int (FK ) |
DimCurrency |
CurrencyKey (PK ) |
DateKey |
int (FK ) |
DimDate |
DateKey (PK ) |
EndOfDayRate |
float |
Nenhum | Nenhum |
Mapear os dados de origem para o destino
Nossa análise dos formatos de dados de origem e destino indicam que as pesquisas são necessárias para os valores CurrencyKey e DateKey. As transformações que executam essas pesquisas obtêm esses valores usando as chaves alternativas das tabelas de dimensões DimCurrency e DimDate.
Coluna de arquivo simples | Nome da tabela | Nome da coluna | Tipo de Dados |
---|---|---|---|
0 | FactCurrencyRate |
AverageRate |
float |
1 | DimCurrency |
CurrencyAlternateKey |
nchar(3) |
2 | DimDate |
FullDateAlternateKey |
date |
3 | FactCurrencyRate |
EndOfDayRate |
float |
Tarefas da lição
Esta lição contém as seguintes tarefas:
Etapa 2: Adicionar e configurar um gerenciador de conexões de Arquivo Simples
Etapa 3: Adicionar e configurar um gerenciador de conexões OLE DB
Etapa 6: Adicionar e configurar as transformações de pesquisa