Carregar dados no Parallel Data Warehouse

Você pode carregar ou inserir dados no SQL Server Parallel Data Warehouse (PDW) usando o Integration Services, o Utilitário bcp, o carregador de linha de comando dwloader ou a instrução SQL INSERT.

Ambiente de carregamento

Para carregar dados, você precisa de um ou mais servidores de carregamento. Você pode usar seu próprio ETL existente ou outros servidores, ou pode adquirir novos servidores. Para obter mais informações, consulte Adquirir e configurar um servidor de carregamento. Estas instruções incluem uma planilha de planejamento da capacidade do servidor de carregamento para ajudá-lo a planejar a solução certa para carregamento.

Carregar com dwloader

Usar o carregador de linha de comando dwloader é a maneira mais rápida de carregar dados no PDW.

Loading process

O dwloader carrega dados diretamente nos nós de computação, sem passar os dados pelo nó de controle. Para carregar dados, o dwloader primeiro se comunica com o nó de controle para obter informações de contato dos nós de computação. O dwloader configura um canal de comunicação com cada nó de computação e, em seguida, envia blocos de dados de 256 KB para os nós de computação com uma distribuição equilibrada.

Em cada nó de computação, o Serviço de movimentação de dados (DMS) recebe e processa os blocos de dados. O processamento dos dados inclui a conversão de cada linha em formato nativo do SQL Server e a computação do hash de distribuição para determinar o nó de computação ao qual cada linha pertence.

Depois de processar as linhas, o DMS usa um movimento aleatório para transferir cada linha para o nó de computação e para a instância corretos do SQL Server. Conforme o SQL Server recebe as linhas, ele as agrupa em lotes de acordo com o parâmetro de tamanho de lote -b definido no dwloader e, em seguida, carrega o lote em massa.

Carregar com instruções preparadas

Você pode usar instruções preparadas para carregar dados em tabelas distribuídas e replicadas. Quando os dados de entrada não correspondem ao tipo de dados de destino, uma conversão implícita é executada. As conversões implícitas com suporte nas instruções preparadas do PDW são um subconjunto de conversões com suporte no SQL Server. Ou seja, apenas um subconjunto de conversões tem suporte, mas as conversões com suporte correspondem às conversões implícitas do SQL Server. Independentemente de a tabela de destino a ser carregada ser definida como uma tabela distribuída ou replicada, as conversões implícitas são aplicadas (se necessário) a todas as colunas existentes na tabela de destino.

Tarefa Descrição
Criar o banco de dados de preparo. Criar o banco de dados de preparo
Carregar com o Integration Services. Carregar com o Integration Services
Entenda as conversões de tipo para dwloader. Regras de conversão de tipo de dados do dwloader
Carregar dados com o dwloader. Carregador de linha de comando dwloader
Entenda as conversões de tipo para INSERT. Carregar dados com INSERT