Especificar terminadores de campo e linha (SQL Server)

Aplica-se a: SQL Server Banco de Dados SQL do Azure Instância Gerenciada de SQL do Azure Azure Synapse Analytics PDW (Analytics Platform System)

Para campos de dados de caracteres, caracteres de terminação opcionais permitem marcar o término de cada campo em um arquivo de dados com um terminador de campo e o término de cada linha com um terminador de linha. Os caracteres terminadores são um modo de indicar aos programas que leem o arquivo de dados onde um campo ou uma linha termina, e onde outro campo ou outra linha começa.

Importante

Quando você usa formato nativo ou nativo Unicode, usa prefixos de comprimento em vez de terminadores de campo. Dados de formato nativo podem conflituar com terminadores, pois um arquivo de dados de formato nativo é armazenado no formato de dados binário interno do Microsoft SQL Server.

Caracteres que têm suporte como terminadores

O comando bcp , a instrução BULK INSERT e o provedor de conjunto de linhas em massa OPENROWSET oferecem suporte a uma variedade de caracteres como terminadores de campo ou de linha e sempre procura a primeira instância de cada terminador. A tabela a seguir lista os caracteres que têm suporte para terminadores.

Caractere terminador Indicado por
Tabulação \t

Este é o terminador de campo padrão.
Caractere de nova linha. \n

Este é o terminador de linha padrão.
Retorno de carro/avanço de linha \r
Barra invertida* \|
Terminador nulo (terminador invisível)** \0
Qualquer caractere imprimível (caracteres de controle não são imprimíveis, exceto nulo, tabulação, nova linha e retorno de carro) (*, A, t, l, etc.)
Cadeia de caracteres de até 10 caracteres imprimíveis, incluindo alguns ou todos os terminadores listados anteriormente (**\t**, end, !!!!!!!!!!, \t-\n e assim por diante)

*Somente os caracteres t, n, r, 0 e '\0' funcionam com o caractere de escape de barra invertida para produzir um caractere de controle.

**Embora o caractere de controle nulo (\0) não seja visível quando impresso, é um caractere distinto no arquivo de dados. Isso significa que usar o caractere de controle nulo como um terminador de campo ou de linha é diferente de não ter nenhum terminador de campo ou de linha.

Importante

Se um caractere terminador ocorrer dentro dos dados, ele será interpretado como um terminador, não como dados, e os dados depois daquele caractere serão interpretados como sendo parte do próximo campo ou registro. Portanto, escolha seus terminadores cuidadosamente para ter certeza de que eles nunca aparecerão em seus dados. Por exemplo, um terminador de campo de alternativo baixo não seria uma boa escolha para um terminador de campo se os dados contiverem esse alternativo baixo.

Usar terminadores de linha

O terminador de linha pode ser o mesmo caractere que o terminador do último campo. Porém, geralmente um terminador de linha distinto é útil. Por exemplo, para produzir saída tabular, termine o último campo de cada linha com o caractere de nova linha (\n) e todos os outros campos com o caractere de tabulação (\t). Para colocar cada registro de dados em sua própria linha no arquivo de dados, especifique a combinação \r\n como terminador de linha.

Observação

Quando você usa o bcp interativamente e especifica\n (nova linha) como terminador de linha, o bcp o prefixa automaticamente com um caractere \r (retorno de carro), o que resulta em um terminador de linha de \r\n.

Especificar terminadores para exportação em massa

Quando você exporta em massa dados char ou nchar , e deseja usar um terminador não padrão, é necessário especificar o terminador para o comando bcp . Você pode especificar terminadores em qualquer uma das seguintes formas:

  • Com um arquivo de formato que especifica o terminador campo por campo.

    Observação

    Para obter informações sobre como usar arquivos de formato, consulte Arquivos de formato para importação ou exportação de dados (SQL Server).

  • Sem um arquivo de formato, existem as seguintes alternativas:

    • Usar a opção -t para especificar o terminador de campo para todos os campos, exceto para o último campo na linha, e usar a opção -r para especificar um terminador de linha.

    • Usar uma opção de formato de caractere (-c ou -w) sem a opção -t , o que define o terminador de campo como o caractere de tabulação, \t. Isso é o mesmo que especificar -t\t.

      Observação

      Se você especificar a opção -n (dados nativos) ou -N (dados nativos Unicode), os terminadores não serão inseridos.

    • Se um comando interativo bcp contiver a opção in ou out sem a opção de arquivo de formato (-f) ou uma opção de formato de dados (-n, -c, -wou -N) e você tiver escolhido não identificar os tamanhos de prefixo e de campo, o comando solicitará o terminador de campo de cada campo com um padrão nenhum:

      Enter field terminator [none]:

      Geralmente, o padrão é uma escolha adequada. No entanto, para os campos de dados char ou nchar, consulte a subseção a seguir, "Diretrizes para usar terminadores". Para obter um exemplo que mostra esse prompt em contexto, consulte Especificar formatos de dados para compatibilidade usando bcp (SQL Server).

      Observação

      Depois que você especificar interativamente todos os campos em um comando bcp, o comando solicitará que salve suas respostas para cada campo em um arquivo de formato não XML. Para obter mais informações sobre arquivos de formato não XML, consulte Arquivos de formato não XML SQL Server.

Diretrizes para uso de terminadores

Em algumas situações, um terminador é útil para um campo de dados char ou nchar . Por exemplo:

  • Para uma coluna de dados que contém um valor nulo em um arquivo de dados que será importado em um programa que não entende as informações de comprimento de prefixo.

    Qualquer coluna de dados que contenha um valor nulo é considerada de comprimento variável. Na ausência de comprimentos de prefixos, um terminador é necessário para identificar o término de um campo nulo, com a certeza de que os dados são corretamente interpretados.

  • Para uma coluna longa de comprimento fixo cujo espaço é apenas parcialmente usado por várias linhas.

    Nessa situação, especificar um terminador pode minimizar o espaço de armazenamento, permitindo que o campo seja tratado como um campo de comprimento variável.

Especificar \n como terminador de linha para exportação em massa

Quando você especifica \n como um terminador de linha para exportação em massa ou usa implicitamente o terminador de linha padrão, o bcp retorna um retorno de carro/alimentação de linha (CRLF) como o terminador da linha. Se você quiser gerar somente um caractere de alimentação de linha (LF) como o terminador de linha, como normalmente ocorre em computadores Unix e Linux, use uma notação hexadecimal para especificar o terminador de linha de LF. Por exemplo:

bcp -r '0x0A'

Exemplos

Este exemplo exporta os dados em massa da tabela AdventureWorks.HumanResources.Department para o arquivo de dados Department-c-t.txt usando o formato de caractere, com uma vírgula como terminador de campo e o caractere de nova linha (\n) como terminador de linha.

O comando bcp contém as opções a seguir.

Switch Descrição
-c Especifica que os campos de dados sejam carregados como dados de caracteres.
-t , Especifica o uma vírgula (,) como terminador de campo.
-r \n Especifica o terminador de linha como um caractere de nova linha. Esse é o terminador de linha padrão, portanto especificá-lo é opcional.
-T Especifica que o utilitário bcp se conecta ao SQL Server com uma conexão confiável usando segurança integrada. Se -T não for especificado, será necessário especificar -U e -P para que o logon tenha êxito.

Para obter mais informações, consulte bcp Utility.

No prompt de comando do Microsoft Windows, insira:

bcp AdventureWorks.HumanResources.Department out C:\myDepartment-c-t.txt -c -t, -r \n -T

Isso cria Department-c-t.txtque contém 16 registros com quatro campos cada. Os campos estão separados por uma vírgula.

Especificar terminadores para importação em massa

Quando você importa em massa dados char ou nchar , o comando de importação em massa deve reconhecer os terminadores usados no arquivo de dados. A especificação dos terminadores depende do comando de importação em massa, como segue:

  • bcp

    A especificação de terminadores para uma operação de importação usa a mesma sintaxe que uma operação de exportação. Para obter mais informações, consulte "Especificando terminadores para exportação em massa", anteriormente neste tópico.

  • BULK INSERT

    Os terminadores podem ser especificados para campos individuais em um arquivo de formato ou para o arquivo de dados inteiro usando os qualificadores mostrados na tabela a seguir.

    Qualificador Descrição
    FIELDTERMINATOR ='field_terminator' Especifica o terminador de campo a ser usado para arquivos de caracteres e dados de caracteres Unicode.

    O padrão é \t (caractere de tabulação).
    ROWTERMINATOR ='row_terminator' Especifica o terminador de linha a ser usado para arquivos de caracteres e dados de caracteres Unicode.

    O padrão é \n (caractere de nova linha).

    Para obter mais informações, confira BULK INSERT (Transact-SQL).

  • INSERT ... SELECT * FROM OPENROWSET(BULK...)

    Para o provedor de conjunto de linhas em massa OPENROWSET, podem ser especificados terminadores somente no arquivo de formato (que é necessário, exceto para tipos de dados de objeto grande). Se um arquivo de dados de caracteres usar um terminador não padrão, ele deverá ser definido no arquivo de formato. Para obter mais informações, veja Criar um arquivo de formato (SQL Server) e Usar um arquivo de formato para importação de dados em massa (SQL Server).

    Para obter mais informações sobre a cláusula OPENROWSET BULK, veja OPENROWSET (Transact-SQL).

Especificar \n como Terminador de linha para importação em massa

Quando você especifica \n como um terminador de linha para importação em massa ou usa implicitamente o terminador de linha padrão, o bcp e a instrução BULK INSERT esperam um retorno de carro/alimentação de linha (CRLF) como o terminador da linha. Se o seu arquivo de origem usar somente um caractere de alimentação de linha (LF) como o terminador de linha, como normalmente ocorre em arquivos gerados em computadores Unix e Linux, use uma notação hexadecimal para especificar o terminador de linha de LF. Por exemplo, em uma instrução BULK INSERT:

 ROWTERMINATOR = '0x0A'

Exemplos

Os exemplos nesta seção importam em massa dados de caracteres do arquivo de dados Department-c-t.txt criado no exemplo anterior na tabela myDepartment no banco de dados de exemplo AdventureWorks2022 . Antes de executar os exemplos, é necessário criar essa tabela. Para criar essa tabela no esquema dbo, no Editor de Consultas do SQL Server Management Studio, execute o seguinte código:

USE AdventureWorks2022;
GO
DROP TABLE myDepartment;
CREATE TABLE myDepartment
(DepartmentID smallint,
Name nvarchar(50),
GroupName nvarchar(50) NULL,
ModifiedDate datetime not NULL CONSTRAINT DF_AddressType_ModifiedDate DEFAULT (GETDATE())
);
GO

R. Usando o bcp para especificar terminadores interativamente

O exemplo a seguir importa em massa o arquivo de dados Department-c-t.txt usando um comando bcp . Esse comando usa as mesmas opções de comando que o comando de exportação em massa. Para obter mais informações, consulte "Especificando terminadores para exportação em massa", anteriormente neste tópico.

No prompt de comando do Windows, insira:

bcp AdventureWorks2022..myDepartment in C:\myDepartment-c-t.txt -c -t , -r \n -T

B. Usando BULK INSERT para especificar terminadores interativamente

O exemplo a seguir importa em massa o arquivo de dados Department-c-t.txt usando uma instrução BULK INSERT que usa os qualificadores mostrados na tabela a seguir.

Opção Atributo
DATAFILETYPE ='char' Especifica que os campos de dados sejam carregados como dados de caracteres.
FIELDTERMINATOR =',' Especifica uma vírgula (,) como terminador de campo.
ROWTERMINATOR ='\n' Especifica o terminador de linha como um caractere de nova linha.

No Editor de Consultas do SQL Server Management Studio, execute o seguinte código:

USE AdventureWorks2022;
GO
BULK INSERT myDepartment FROM 'C:\myDepartment-c-t.txt'
     WITH (
     DATAFILETYPE = 'char',
     FIELDTERMINATOR = ',',
     ROWTERMINATOR = '\n'
);
GO

Próximas etapas