Configurar o Azure Cosmos DB para MongoDB em uma atividade de cópia
Este artigo descreve como usar a atividade de cópia em pipelines de dados para copiar dados de e para o Azure Cosmos DB para MongoDB.
Configuração suportada
Para a configuração de cada guia em atividade de cópia, vá para as seções a seguir, respectivamente.
- General (Geral)
- Source
- Destino
- Mapeamento
- Definições
Geral
Consulte as orientações de configurações gerais para configurar a guia Configurações gerais.
Origem
Vá para a guia Origem para configurar sua fonte de atividade de cópia. Consulte o conteúdo a seguir para obter a configuração detalhada.
As seguintes propriedades são necessárias:
- Conexão: selecione uma conexão do Azure Cosmos DB para MongoDB na lista de conexões. Se nenhuma conexão existir, crie uma nova conexão do Azure Cosmos DB para MongoDB selecionando Mais na parte inferior da lista de conexões.
- Banco de dados: Selecione seu banco de dados na lista suspensa.
- Nome da coleção: especifique o nome da coleção do Azure Cosmos DB. Você pode selecionar a coleção na lista suspensa.
Em Avançado, você pode especificar os seguintes campos:
- Filtro: especifica o filtro de seleção usando operadores de consulta. Para retornar todos os documentos de uma coleção, omita esse parâmetro ou passe um documento vazio ({}).
- Métodos do cursor: Selecione + Novo para especificar a maneira como a consulta subjacente é executada. As maneiras de executar a consulta são:
- project: Especifica os campos a serem retornados nos documentos para projeção. Para retornar todos os campos nos documentos correspondentes, omita esse parâmetro.
- sort: especifica a ordem na qual a consulta retorna documentos correspondentes. Vá para cursor.sort() para obter mais informações.
- limit: Especifica o número máximo de documentos retornados pelo servidor. Vá para cursor.limit() para obter mais informações.
- skip: Especifica o número de documentos a serem ignorados e de onde o MongoDB começa a retornar resultados. Vá para cursor.skip() para obter mais informações.
- Tamanho do lote: especifica o número de documentos a serem retornados em cada lote da resposta da instância do MongoDB. Na maioria dos casos, modificar o tamanho do lote não afetará o usuário ou o aplicativo. Os limites do Azure Cosmos DB para cada lote não podem exceder 40 MB de tamanho, que é a soma do número de tamanho de lote dos documentos, portanto, diminua esse valor se o tamanho do documento for grande. O valor predefinido é 100.
- Colunas adicionais: adicione colunas de dados adicionais para armazenar o caminho relativo ou o valor estático dos arquivos de origem. A expressão é suportada para este último.
Destino
Vá para a guia Destino para configurar o destino da atividade de cópia. Consulte o conteúdo a seguir para obter a configuração detalhada.
As seguintes propriedades são necessárias:
- Conexão: selecione uma conexão do Azure Cosmos DB para MongoDB na lista de conexões. Se nenhuma conexão existir, crie uma nova conexão do Azure Cosmos DB para MongoDB selecionando Mais na parte inferior da lista de conexões.
- Banco de dados: Selecione seu banco de dados na lista suspensa.
- Nome da coleção: especifique o nome da coleção do Azure Cosmos DB. Você pode selecionar a coleção na lista suspensa.
Em Avançado, você pode especificar os seguintes campos:
Comportamento de gravação: descreve como gravar dados no Azure Cosmos DB para MongoDB. Valores permitidos: Inserir e Upsert.
O comportamento do Upsert é substituir o documento se já existir um documento com o mesmo
_id
, caso contrário, insira o documento.Nota
O serviço gera automaticamente um
_id
para um documento se um_id
não for especificado no documento original ou por mapeamento de coluna. Isso significa que você deve garantir que, para que o Upsert funcione conforme o esperado, seu documento tenha uma identificação.Tempo limite de gravação do lote: especifique o tempo de espera para que a operação de inserção do lote seja concluída antes que ela atinja o tempo limite. O valor permitido é timespan e o valor padrão é 00:30:00 (30 minutos).
Tamanho do lote de gravação: esta propriedade controla o tamanho dos documentos a serem gravados em cada lote. Você pode tentar aumentar o valor para melhorar o desempenho e diminuir o valor se o tamanho do documento for grande. O valor padrão é 10.000.
Mapeamento
Para a configuração da guia Mapeamento , consulte Configurar seus mapeamentos na guia mapeamento. O mapeamento não é suportado quando a origem e o destino são dados hierárquicos.
Definições
Para Configuração da guia Configurações , vá para Configurar suas outras configurações na guia Configurações.
Resumo da tabela
A tabela a seguir contém mais informações sobre a atividade de cópia no Azure Cosmos DB para MongoDB.
Fonte da informação
Nome | Descrição | valor | Necessário | Propriedade de script JSON |
---|---|---|---|---|
Ligação | Sua conexão com o armazenamento de dados de origem. | < sua conexão do Azure Cosmos DB para MongoDB > | Sim | ligação |
Base de dados | Seu banco de dados que você usa como fonte. | < A sua base de dados > | Sim | base de dados |
Nome da coleção | O nome da coleção do Azure Cosmos DB. | < A sua coleção > | Sim | Coleção |
Filtro | O filtro de seleção usando operadores de consulta. Para retornar todos os documentos de uma coleção, omita esse parâmetro ou passe um documento vazio ({}). | < O seu filtro de seleção > | Não | filtrar |
Métodos de cursor | A maneira como a consulta subjacente é executada. | • Projeto • ordenar • limite • pular |
Não | cursorMethods: • Projeto • ordenar • limite • pular |
Tamanho do lote | O número de documentos a serem retornados em cada lote da resposta da instância do MongoDB. Na maioria dos casos, modificar o tamanho do lote não afetará o usuário ou o aplicativo. Os limites do Azure Cosmos DB para cada lote não podem exceder 40 MB de tamanho, que é a soma do número de tamanho de lote dos documentos, portanto, diminua esse valor se o tamanho do documento for grande. | < o tamanho do lote de gravação > (o padrão é 100) |
Não | batchSize |
Colunas adicionais | Adicione colunas de dados adicionais para armazenar o caminho relativo ou o valor estático dos arquivos de origem. A expressão é suportada para este último. | • Nome • Valor |
Não | adicionaisColunas: • nome • valor |
Informações sobre o destino
Nome | Descrição | valor | Necessário | Propriedade de script JSON |
---|---|---|---|---|
Ligação | Sua conexão com o armazenamento de dados de destino. | < sua conexão do Azure Cosmos DB para MongoDB > | Sim | ligação |
Base de dados | Seu banco de dados que você usa como destino. | < A sua base de dados > | Sim | base de dados |
Nome da coleção | O nome da coleção do Azure Cosmos DB. | < A sua coleção > | Sim | Coleção |
Comportamento de escrita | Descreve como gravar dados no Azure Cosmos DB para MongoDB. Valores permitidos: Inserir e Upsert. O comportamento do Upsert é substituir o documento se já existir um documento com o mesmo _id , caso contrário, insira o documento.Nota: O serviço gera automaticamente um _id para um documento se um _id não for especificado no documento original ou por mapeamento de coluna. Isso significa que você deve garantir que, para que o Upsert funcione conforme o esperado, seu documento tenha uma identificação. |
• Inserir (padrão) • Upsert |
Não | writeBehavior: • inserir • Upsert |
Tempo limite de gravação em lote | O tempo de espera para que a operação de inserção de lote termine antes que ela atinja o tempo limite. | timespan (o padrão é 00:30:00 - 30 minutos) |
Não | writeBatchTimeout |
Tamanho do lote de gravação | Controla o tamanho dos documentos a serem gravados em cada lote. Você pode tentar aumentar esse valor para melhorar o desempenho e diminuir o valor se o tamanho do documento for grande. | < o tamanho do lote de gravação > (o padrão é 10.000) |
Não | writeBatchSize |