Tarefa do Azure Synapse Analytics
Aplica-se a: SQL Server SSIS Integration Runtime no Azure Data Factory
A Tarefa do Azure Synapse Analytics habilita um pacote do SSIS a copiar dados de tabela para o pool de SQL dedicado do Azure Synapse Analytics do sistema de arquivos ou do Armazenamento de Blobs do Azure. A tarefa aproveita o PolyBase para melhorar o desempenho, conforme descrito no artigo Estratégias e padrões de carregamento do Azure Synapse Analytics. O formato de arquivo de dados de origem com suporte atualmente é texto delimitado em codificação UTF8. Ao copiar do sistema de arquivos, primeiro os dados serão carregados no Armazenamento de Blobs do Azure para o preparo e, depois, para o pool de SQL dedicado. Portanto, é necessário uma conta de Armazenamento de Blobs do Azure.
Observação
Não há suporte para o gerenciador de conexões do Armazenamento do Azure com o tipo de serviço do Data Lake Gen2.
Para usar o Azure Data Lake Gen2 para preparo ou origem, você pode se conectar por meio do gerenciador de conexões do Armazenamento do Azure com o tipo Armazenamento de Blobs do Azure.
A Tarefa do Azure Synapse Analytics é um componente do Feature Pack do SSIS (SQL Server Integration Services) para Azure.
Para adicionar uma Tarefa do Azure Synapse Analytics, arraste-a da Caixa de Ferramentas do SSIS e solte-a na tela do designer, então clique duas vezes ou clique com o botão direito do mouse em Editar para ver a caixa de diálogo Editor da Tarefa.
Na página Geral , defina as propriedades a seguir.
SourceType especifica o tipo de armazenamento de dados de origem. Selecione um dos seguintes tipos:
- FileSystem: dados de origem residem no sistema de arquivos local.
- BlobStorage: Dados de origem residem no Armazenamento de Blobs do Azure.
A seguir, as propriedades para cada tipo de fonte.
FileSystem
Campo | DESCRIÇÃO |
---|---|
LocalDirectory | Especifica o diretório local que contém os arquivos de dados a serem carregados. |
Recursivamente | Especifica se os subdiretórios devem ser pesquisados recursivamente. |
FileName | Especifica um filtro de nome para selecionar arquivos com o padrão de nome determinado. Por exemplo, MySheet*.xsl* incluirá arquivos como MySheet001.xsl e MySheetABC.xslx. |
RowDelimiter | Especifica os caracteres que marcam o final de cada linha. |
ColumnDelimiter | Especifica um ou mais caracteres que marcam o final de cada coluna. Por exemplo, | (barra vertical) \t (tabulação), ' (aspa simples), "(aspas duplas) e 0x5c (barra invertida). |
IsFirstRowHeader | Especifica se a primeira linha em cada arquivo de dados contém nomes de coluna em vez de dados reais. |
AzureStorageConnection | Especifica um gerenciador de conexões do Armazenamento do Azure. |
BlobContainer | Especifica o nome do contêiner de blob no qual os dados locais serão carregados e retransmitidos ao pool de SQL dedicado do Azure Synapse Analytics através do PolyBase. Um novo contêiner será criado, caso não exista. |
BlobDirectory | Especifica o diretório de blob (estrutura hierárquica virtual) no qual os dados locais serão carregados e retransmitidos ao pool de SQL dedicado do Azure Synapse Analytics através do PolyBase. |
RetainFiles | Especifica se os arquivos carregados no Armazenamento do Azure serão mantidos. |
CompressionType | Especifica o formato de compactação a ser usado ao carregar arquivos no Armazenamento do Azure. A origem local não é afetada. |
CompressionLevel | Especifica o nível de compactação a ser usado para o formato de compactação. |
SqlPoolConnection | Especifica um gerenciador de conexões ADO.NET para o pool de SQL dedicado do Azure Synapse Analytics. |
TableName | Especifica o nome da tabela de destino. Escolha um nome de tabela existente ou crie uma nova tabela escolhendo <Nova Tabela...>. |
TableDistribution | Especifica o método de distribuição para a nova tabela. Aplica-se caso um novo nome de tabela para TableNameseja especificado. |
HashColumnName | Especifica a coluna usada para a distribuição da tabela de hash. Aplica-se caso HASH for especificado para TableDistribution. |
BlobStorage
Campo | DESCRIÇÃO |
---|---|
AzureStorageConnection | Especifica um gerenciador de conexões do Armazenamento do Azure. |
BlobContainer | Especifica o nome do contêiner de blob em que os dados de origem residem. |
BlobDirectory | Especifica o diretório de blobs (estrutura hierárquica virtual) em que os dados de origem residem. |
RowDelimiter | Especifica os caracteres que marcam o final de cada linha. |
ColumnDelimiter | Especifica um ou mais caracteres que marcam o final de cada coluna. Por exemplo, | (barra vertical) \t (tabulação), ' (aspa simples), "(aspas duplas) e 0x5c (barra invertida). |
CompressionType | Especifica o formato de compactação usado para dados de origem. |
SqlPoolConnection | Especifica um gerenciador de conexões ADO.NET para o pool de SQL dedicado do Azure Synapse Analytics. |
TableName | Especifica o nome da tabela de destino. Escolha um nome de tabela existente ou crie uma nova tabela escolhendo <Nova Tabela...>. |
TableDistribution | Especifica o método de distribuição para a nova tabela. Aplica-se caso um novo nome de tabela para TableNameseja especificado. |
HashColumnName | Especifica a coluna usada para a distribuição da tabela de hash. Aplica-se caso HASH for especificado para TableDistribution. |
Você verá uma página Mapeamentos diferente caso esteja copiando para uma tabela nova ou para uma tabela existente. No primeiro caso, configure quais colunas de origem serão mapeadas e os nomes correspondentes na tabela de destino a ser criada. No último caso, configure as relações de mapeamento entre colunas de origem e de destino.
Na página Colunas , configure as propriedades de tipo de dados para cada coluna de origem.
A página T-SQL mostra o T-SQL usado para carregar os dados do Armazenamento de Blobs do Azure para o pool de SQL dedicado. O T-SQL é gerado automaticamente de configurações nas outras páginas e será executado como parte da execução da tarefa. Você pode optar por editar manualmente o T-SQL gerado para atender às suas necessidades específicas clicando no botão Editar . Depois, você pode reverter para aquele que foi gerado automaticamente, clicando no botão Redefinir .