Visão geral da atualização de dados do PowerPivot

Uma operação de atualização de dados PowerPivot é um processo agendado que é executado em uma instância de servidor do Analysis Services em um farm de servidores do SharePoint. Você pode agendar a atualização de dados como uma operação do lado de servidor para reimportar dados de fontes externas de dados em intervalos regulares, substituindo dados mais antigos em pastas de trabalho do PowerPivot que você abre de sites do SharePoint.

Este tópico explica como funciona a atualização de dados. Os administradores ou autores da pasta de trabalho podem usar essas informações para obter uma compreensão do processo global antes de solucionar os problemas de atualização de dados que ocorrem.

Outros recursos para aprender sobre a atualização de dados PowerPivot incluem o seguinte white paper, Everything you always wanted to know about PowerPivot data refresh but were afraid to ask (página em inglês).

Este tópico contém as seguintes seções:

Arquitetura da atualização de dados

Contas usadas na atualização de dados

Configurando a atualização de dados

Configuração de um agendamento de atualização de dados

Disparando a atualização de dados

Processando a atualização de dados

Cancelando a atualização de dados

Excluindo um agendamento de atualização de dados

ObservaçãoObservação

A atualização de dados PowerPivot não está relacionada ao recurso de atualização de dados do Excel e você não pode atualizar os dados PowerPivot usando o recurso padrão de atualização de dados do Excel. Em um servidor do SharePoint que tem uma instalação do PowerPivot para SharePoint, a atualização de dados PowerPivot é configurada por meio da página do aplicativo Gerenciar Atualização de Dados PowerPivot em seu site do SharePoint e executada somente para dados PowerPivot inseridos em uma pasta de trabalho publicada.

Arquitetura da atualização de dados

Atualizar dados PowerPivot em uma pasta de trabalho do Excel é um processo que é disparado, executado e gerenciado por componentes de servidor do Analysis Services e do PowerPivot em um farm do SharePoint. Um aplicativo de serviço do PowerPivot inicia a atualização de dados executando um trabalho de atualização de dados e finaliza verificando o arquivo de dados atualizados após a conclusão. A recuperação de dados é executada pela instância do Analysis Services. Ela abre uma conexão a fontes de dados externas, envia as consultas e substitui dados existentes por um conjunto de resultados mais novo. Quando você define uma agenda, a atualização de dados será executada por conta própria, mas você pode exibir o histórico de atualização de dados para verificar o status dos resultados de processamento reais.

Em contraste com o processamento de dados sob demanda que é iniciado pelo usuário, o processamento de atualização de dados é baseado em agendamentos predefinidos que determinam quando o processamento deve ocorrer. O agendamento também define quais fontes de dados devem participar da operação de atualização e as credenciais usadas para acessar a pasta de trabalho e as fontes de dados externas. O serviço PowerPivot usa estas informações para iniciar, executar e salvar dados atualizados em uma pasta de trabalho como um processo automatizado.

Para que a atualização de dados seja bem-sucedida, os serviços devem ter acesso a credenciais de armazenamento que são usadas para executar o trabalho de atualização de dados e conectar-se a fontes de dados. O recurso do SharePoint usado para armazenar credenciais é o Serviço de Repositório Seguro. O Serviço de Repositório Seguro é um aplicativo do SharePoint que faz parte do produto SharePoint. Você pode habilitar isto para dar suporte a cenários de atualização de dados. A Instalação do SQL Server também pode habilitar e provisionar isto para você, se você usou a opção de instalação Novo Servidor para configurar o servidor.

Componentes que dão suporte à atualização de dados incluem o seguinte:

  • Trabalho de timer da atualização de dados do PowerPivot

  • Aplicativo do serviço PowerPivot

  • Serviço Analysis Services 

Um trabalho de timer de atualização de dados do PowerPivot é executado todos os minutos em cada servidor do PowerPivot no farm. O trabalho de timer chama o serviço PowerPivot para ler agendas predefinidas no banco de dados de aplicativo do PowerPivot. O trabalho de timer é executado pelo Temporizador do SharePoint 2010, que é executado em todos os computadores membros do farm do SharePoint. Quando uma agenda é localizada, o trabalho de timer da Atualização de Dados do PowerPivot passa a solicitação a um aplicativo do serviço PowerPivot associado ao aplicativo web que fornece a pasta de trabalho. Se houver várias instâncias do Serviço Analysis Services no farm, um esquema de balanceamento de carga será usado para determinar qual servidor receberá a solicitação.

O servidor que recebe a solicitação adiciona-a à fila de processamento da instância do Serviço Analysis Services local. O aplicativo de serviço do PowerPivot lê a definição de agendamento para obter o local da pasta de trabalho, a lista de fontes de dados para atualizar e as credenciais do usuário sob as quais o processo ocorrerá. Ele transmite estas informações à instância do Serviço Analysis Services.

A instância do Serviço Analysis Services verifica se há recursos do sistema suficientes e, em seguida, carrega a fonte de dados do PowerPivot. Ela então abre as conexões para fontes de dados externas usando as credenciais que são especificadas na definição de agendamento ou dentro da fonte de dados do PowerPivot. Os dados atuais da fonte de dados externa substituem linhas existentes na fonte de dados do PowerPivot. São ignoradas novas colunas ou tabelas; a atualização de dados não pode ser usada para acrescentar novas tabelas ou colunas à fonte de dados.

Depois que todos os dados são recuperados de fontes externas, o aplicativo de serviço do PowerPivot verifica na biblioteca de conteúdo para saber se a pasta de trabalho pode ser salvada. Se a pasta de trabalho não for verificada ou aberta para editar, o serviço salvará a pasta de trabalho atualizada na biblioteca e registrará em log um evento para o sistema de coleta de dados de uso no farm. Se o arquivo for verificado fora ou aberto, a versão atualizada da pasta de trabalho será descartada.

A atualização de dados é desabilitada por padrão. Para obter mais informações sobre como habilitar e configurar a atualização de dados, consulte Habilitar e configurar a atualização de dados PowerPivot.

Contas usadas na atualização de dados

As pastas de trabalho do PowerPivot que são publicadas no SharePoint podem ser automaticamente atualizadas para usar dados mais novos de origens externas que forneceram os dados originais. No momento programado, o servidor conectará a origens externas e reimportará dados usando as consultas e as informações de conexão dentro da pasta de trabalho.

A fim de estabelecer uma conexão a fontes de dados externas e concluir a operação de atualização de dados, o servidor deverá ter o seguinte:

  • Uma identidade de usuário sob a qual a operação de atualização de dados será executada.

  • Uma identidade de usuário para conectar-se a fontes de dados externas.

Embora o aplicativo de serviço do PowerPivot gerencie uma solicitação de atualização de dados, ele não executa o trabalho propriamente dito. Em vez disso, ele representa outro usuário (ou a conta autônoma de atualização de dados ou as credenciais do Windows de um usuário do SharePoint) para executar o processo e assegurar que histórico de atualização de dados seja coletado para aquele usuário. A atualização de dados agendada também pode usar credenciais armazenadas para conectar-se a fontes de dados externas. Todas as credenciais usadas na atualização de dados do PowerPivot são armazenadas no SharePoint, exigindo que você possa habilitar e configurar o Serviço de Repositório Seguro como uma etapa de pré-requisito. Você especifica quais contas devem ser usadas ao definir a agenda.

A tabela seguinte descreve as diferentes opções para especificar identidades usadas na atualização de dados:

Finalidade

Abordagem

Descrição

Requisitos

Executar o trabalho

Usar a conta autônoma de atualização de dados do PowerPivot.

Quando você escolher esta opção para uma pasta de trabalho, todos os históricos de atualização de dados e dados de uso que são coletados são baseados na conta autônoma. Se você precisar de uma abordagem mais granular, use uma das outras abordagens listadas abaixo.

Um aplicativo de destino no Serviço de Repositório Seguro deve ser criado com antecedência para armazenar a conta autônoma de atualização de dados.

A Instalação do SQL Server criará a conta autônoma de atualização de dados automaticamente se você usar a opção de instalação Novo Servidor. A conta é baseada na conta de Farm usada para provisionar todos os serviços para este tipo de instalação.

Caso contrário, para todos os outros cenários de instalação, você deverá criar essa conta manualmente.

Para obter instruções, consulte Configurar e usar a conta autônoma de atualização de dados PowerPivot.

Usar qualquer conta de usuário de domínio do Windows.

Se você desejar que o histórico de atualização de dados ou os dados de uso se baseiem em uma identidade de usuário específica, poderá configurar aplicativos de destino para as contas que deseja usar.

Você deve criar um aplicativo de destino no Serviço de Repositório Seguro para armazenar as credenciais da conta a ser usada.

Para obter instruções, consulte Configure any Windows account for data refresh.

Usar a conta do Windows da pessoa que está agendando o trabalho.

O serviço PowerPivot criará aplicativos de destino rapidamente para armazenar as credenciais de usuário do Windows da pessoa que está configurando a agenda de atualização de dados e então excluirá os aplicativos quando a agenda não existir mais.

None. Essas credenciais são automaticamente armazenadas e então removidas automaticamente quando não houver mais agendamento.

Conectar-se a fontes de dados externas

Use a cadeia de conexão e credenciais que estão inseridas dentro da pasta de trabalho.

As informações de conexão estão armazenadas dentro da pasta de trabalho quando os dados são importados pela primeira vez. A cadeia de conexão, as credenciais e as consultas são uma parte permanente da pasta de trabalho do PowerPivot. Você pode substituir as credenciais que usam qualquer uma das opções seguintes nesta tabela.

None. As informações de conexão já estão disponíveis.

Usar as credenciais de usuário do Windows

Use esta opção para substituir um nome de usuário de domínio e senha do Windows armazenados com a sequência de conexão.

Você deve criar um aplicativo de destino no Serviço de Repositório Seguro para armazenar as credenciais da conta a ser usada.

Para obter instruções, consulte Configure any Windows account for data refresh.

Usar credenciais de banco de dados ou de terceiros

Use esta opção para substituir credenciais que não sejam do Windows na cadeia de conexão.

Você deve criar um aplicativo de destino no Serviço de Repositório Seguro para armazenar as credenciais da conta a ser usada.

Para obter instruções, consulte Configure a predefined account for accessing external or third-party data sources.

Configurando a atualização de dados

Para que os usuários possam configurar uma agenda de atualização de dados, um administrador de farm ou aplicativo de serviço deve habilitar a atualização de dados. Por padrão, a atualização de dados não está disponível. Um administrador habilita a atualização de dados através das seguintes ações:

  • Habilita e configura o Serviço de Repositório Seguro. Essa etapa habilita o nível mínimo de funcionalidade da atualização de dados. A saber, um proprietário ou autor de pasta de trabalho pode definir que uma agenda de atualização de dados seja executada com suas credenciais.

  • Instala quaisquer provedores de dados usados para importar dados para uma pasta de trabalho PowerPivot que ainda não estejam instalados no servidor.

  • Como opção, configura a conta Autônoma de Atualização de Dados do PowerPivot. Essa etapa habilita a opção Usar a conta de atualização de dados configurada pelo administrador em uma página de agendamento de dados do PowerPivot. Talvez um usuário queira utilizar a conta autônoma em vez de suas credenciais para executar um trabalho de atualização de dados. Se as propriedades de conexão na pasta de trabalho forem configuradas para não usar autenticação, a conta de atualização de dados autônoma do PowerPivot deverá ser configurada para que a atualização de dados funcione.

  • Opcionalmente, configura uma conta de usuário do Windows arbitrária que pode ser usada para executar trabalhos de atualização de dados. Como um administrador, talvez você queira disponibilizar várias contas para executar a atualização de dados. Você pode usar o Serviço de Repositório Seguro para criar aplicativos de destino para essas contas e então disponibilizar as IDs de aplicativo de destino para usuários, de forma que eles possam especificá-las no agendamento da atualização de dados.

Um administrador de farm ou servidor também pode configurar o modo de processamento da atualização de dados para o servidor do PowerPivot. O modo de processamento da atualização de dados é habilitado por padrão, mas como administrador, você deveria saber que esse modo de processamento pode estar desabilitado para o servidor. Se a atualização de dados parecer não estar funcionando, marcar essa opção de servidor deve ser a primeira etapa na solução do problema. Para obter mais informações, consulte Configurar o processamento dedicado de atualização de dados ou de somente consulta.

Configuração de um agendamento de atualização de dados

Um autor ou proprietário da pasta de trabalho define o agendamento da atualização de dados para a pasta de trabalho que ele ou ela salvou para o SharePoint. A pessoa que agendar a atualização de dados deve ter a permissão Contribute (Colaborar) para a pasta de trabalho no site do SharePoint.

Um proprietário da pasta de trabalho configura a atualização de dados especificando o seguinte:

  • Uma agenda que determina com que frequência os dados serão atualizados.

  • Uma conta para executar o trabalho de atualização de dados (ou a conta autônoma de atualização de dados ou as credenciais do Windows de um usuário do SharePoint).

  • Fontes de dados selecionadas para incluir na operação de atualização de dados. As fontes de dados devem estar acessíveis em uma conexão de rede. Se você importar dados de um arquivo local em sua estação de trabalho, essa fonte de dados muito provavelmente não estará disponível para o servidor quando ele tentar atualizar dados dessa fonte. Também são necessárias permissões para os arquivos de dados. Nem todas as fontes de dados atenderão os requisitos para atualização de dados. Você pode excluir as fontes de dados que poderiam falhar durante uma operação de atualização.

  • Como opção, as credenciais usadas para acessar fontes de dados externas que fornecem dados atualizados. Por padrão, as credenciais que foram utilizadas para obter os dados originalmente são reutilizadas para a atualização de dados, mas você pode substituir isto inserindo credenciais diferentes na agenda.

Existe uma agenda de atualização de dados do PowerPivot para cada pasta de trabalho. Qualquer usuário que tenha permissões de colaboração na pasta de trabalho pode criar ou modificar a agenda de atualização de dados.

A atualização de dados é por padrão desabilitada, mas um administrador de aplicativo de serviço pode habilitá-la para um aplicativo de serviço do PowerPivot. Para obter mais informações sobre como configurar a atualização de dados, consulte Agendar a atualização de dados PowerPivot.

Disparando a atualização de dados

Os agendamentos da atualização de dados são armazenados em um banco de dados do aplicativo de serviço do PowerPivot e disparado pelo trabalho de timer da Atualização de Dados do PowerPivot que é executado em um servidor de aplicativo. O trabalho de timer chama o serviço PowerPivot para ler as informações de agendamento de seu banco de dados. Por padrão, o trabalho de timer examina a intervalos de um minuto, que é o menor intervalo permitido para trabalhos de timer em um farm do SharePoint.

O trabalho de timer é executado em cada servidor físico que possui a instância do PowerPivot para SharePoint no farm. O próprio trabalho de timer é definido como trabalho do nível do farm. Você pode exibir e configurar as propriedades de trabalho de timer na página de Monitoramento em Administração Central. As configurações que você define se aplicarão a todos os trabalhos de timer de atualização de dados do PowerPivot no farm.

Quando o trabalho de timer detecta uma agenda de atualização de dados definida pelo usuário, ele entrega uma solicitação de processamento de dados a um serviço do PowerPivot para colocar na fila de processamento da instância de servidor do Analysis Services local. Se não houver nenhuma instância local do Analysis Services, o trabalho acrescentará a solicitação a outra instância que é associada ao aplicativo Web. Quando uma solicitação está na fila, permanece lá até que seja processada ou cancelada.

Você não pode priorizar ou reorganizar a fila de processamento, mas pode usar uma ação de Executar Agora para forçar uma atualização de dados imediata. Para obter mais informações, consulte Agendar a atualização de dados PowerPivot.

Processando a atualização de dados

A atualização de dados terá sucesso se a instância de servidor do Analysis Services puder recuperar os dados atualizados de todas as fontes de dados especificadas na agenda. Se a recuperação falhar para uma fonte de dados, nenhum dos dados atualizados será salvo. 

A ilustração a seguir mostra as etapas em uma operação de atualização de dados.

Diagrama de sequência para atualização de dados

A tabela seguinte descreve ações de servidor quando uma operação de atualização de dados começa:

1

Uma verificação de autorização confere se o usuário tem permissões suficientes para solicitar dados atualizados para a fonte de dados do PowerPivot. O trabalho de atualização de dados representa a identidade da conta autônoma de atualização de dados ou o usuário do Windows especificado na definição de agenda e, usando aquela identidade, abre o arquivo de pasta de trabalho do banco de dados de conteúdo.

2

O servidor lê a lista de fontes de dados que são agendadas para a operação de atualização de dados atual. A lista consistirá em todas as fontes de dados que atualmente contribuem com dados à fonte de dados do PowerPivot ou fontes de dados individuais que foram selecionadas explicitamente para operações de atualização de dados. Um usuário pode escolher um subconjunto das fontes de dados para a agenda.

O serviço abre uma conexão para cada fonte de dados usando a cadeia de conexão que é armazenada dentro da fonte de dados do PowerPivot. Dependendo de como a agenda de atualização de dados é definida, as credenciais para a conexão serão lidas a partir da cadeia de conexão ou do Repositório Seguro, se a pessoa que agenda a atualização de dados inseriu as credenciais fornecidas para conexão a uma fonte de dados específica.

Cada fonte de dados é aberta e consultada em paralelo. Se uma fonte de dados não estiver disponível ou se ocorrer um erro, a atualização de dados emitirá um erro que indica a causa do problema. O trabalho de atualização de dados deixará de ser processado e um erro será gravado no histórico de atualização de dados.

3

Se a atualização de dados for bem-sucedida para todas as fontes de dados, os dados e pasta de trabalho serão salvas no banco de dados de conteúdo. A operação será registrada em log no histórico de atualização de dados. A identidade do usuário do Windows ou a conta autônoma de atualização de dados é incluída na entrada do log.

A pasta de trabalho não pode ter check-out feito quando o servidor tenta salvar os dados atualizados. Se for realizado check-out na pasta de trabalho, o servidor descartará os dados atualizados se ele não puder salvar a pasta de trabalho atualizada. Se a pasta de trabalho não for bloqueada para edição, a pasta de trabalho atualizada será salva usando as credenciais do Windows especificadas na agenda ou a conta autônoma de atualização de dados.

Medindo recursos do sistema para atualização de dados

O processamento da atualização de dados somente ocorrerá se o servidor tiver memória suficiente para iniciar o processo; a memória suficiente é medida como uma vez e meia o tamanho de arquivo. As solicitações para atualização de dados são alocadas usando o mesmo esquema de balanceamento de carga usado para consultas sob demanda. Se o aplicativo de serviço do PowerPivot usar rodízio, as solicitações de atualização de dados serão alocadas para o próximo servidor. A metodologia baseada em integridade aloca a solicitação para o servidor que tem mais recursos disponíveis. Cada servidor é consultado para obter informações do sistema. Se todos os servidores estiverem sob pressão de memória, uma ou mais fontes de dados serão descarregadas para abrir espaço para o trabalho de atualização de dados. São removidas primeiramente as fontes de dados que estiveram inativas por mais tempo. Se os servidores não estiverem sob pressão de memória e se houver vários candidatos, a metodologia de alocação usará outros critérios, como a disponibilidade de uma fonte de dados do PowerPivot armazenada em cache que pode ser carregada imediatamente em vez de ser recuperada de um banco de dados de conteúdo.

Por padrão, os trabalhos de atualização de dados do PowerPivot e consultas sob demanda compartilham os mesmos recursos físicos de servidor em um servidor de aplicativos. Você pode modificar este comportamento configurando uma instância do Serviço Analysis Services específica somente para dar suporte a consultas sob demanda ou atualização de dados. Você também pode alterar o número de trabalhos de atualização de dados que podem ser executados simultaneamente. Para obter mais informações, consulte Configurar o processamento dedicado de atualização de dados ou de somente consulta.

Cancelando a atualização de dados

Se o servidor estiver sob pressão e não puder processar uma atualização de dados no momento agendado, a solicitação permanecerá na fila e o servidor a processará quando recursos do sistema ficarem disponíveis.

Se, por algum motivo, os recursos do sistema nunca ficarem disponíveis, o servidor cancelará a solicitação, a removerá da fila, registrará o evento no histórico de atualização de dados e opcionalmente notificará o proprietário do documento por email de que o processo foi cancelado. O cancelamento ocorrerá da próxima vez que o processo for programado para ser executado. Por exemplo, se uma atualização de dados agendada para 9 horas da manhã de quarta-feira não ocorreu, um cancelamento ocorreria na manhã da quarta-feira seguinte às 9h, quando o servidor detectará uma solicitação não processada na fila.

Você não pode cancelar manualmente uma operação de atualização de dados depois que ela iniciar, mas você poderá desabilitar o agendamento antecipadamente para impedir sua execução. Para obter mais informações sobre como desabilitar a atualização de dados para uma pasta de trabalho específica, consulte Agendar a atualização de dados PowerPivot. Para obter mais informações sobre como desativar a atualização de dados no servidor, consulte Configurar o processamento dedicado de atualização de dados ou de somente consulta.

Excluindo um agendamento de atualização de dados

Os agendamentos da atualização de dados fazem parte dos metadados que são armazenados e mantidos para uma pasta de trabalho PowerPivot. Como um agendamento não é um arquivo separado, você não poderá excluí-lo independentemente da pasta de trabalho que o usar. Se você não precisar mais atualizar os dados em uma pasta de trabalho, desmarque a caixa de seleção Habilitar no agendamento. O agendamento não será mais executado e, após um período de inatividade, as informações de agendamento que foram especificadas anteriormente serão removidas.

Excluir uma pasta de trabalho exclui qualquer agendamento de atualização de dados que esteja associado à pasta de trabalho. Se você reciclar a pasta de trabalho subsequentemente, as informações de agendamento também serão recicladas e continuarão no mesmo agendamento.