Fiabilidade nos Hubs de Eventos do Azure

Este artigo descreve o suporte à confiabilidade nos Hubs de Eventos do Azure e aborda a resiliência intrarregional com zonas de disponibilidade, recuperação de desastres entre regiões e continuidade de negócios. Para obter uma visão geral mais detalhada dos princípios de confiabilidade no Azure, consulte Confiabilidade do Azure.

Suporte à zona de disponibilidade

As zonas de disponibilidade do Azure são pelo menos três grupos fisicamente separados de datacenters em cada região do Azure. Os datacenters dentro de cada zona são equipados com infraestrutura independente de energia, resfriamento e rede. No caso de uma falha de zona local, as zonas de disponibilidade são projetadas de modo que, se uma zona for afetada, os serviços regionais, a capacidade e a alta disponibilidade sejam suportados pelas duas zonas restantes.

As falhas podem variar de falhas de software e hardware a eventos como terremotos, inundações e incêndios. A tolerância a falhas é alcançada com redundância e isolamento lógico dos serviços do Azure. Para obter informações mais detalhadas sobre zonas de disponibilidade no Azure, consulte Regiões e zonas de disponibilidade.

Os serviços habilitados para zonas de disponibilidade do Azure são projetados para fornecer o nível certo de confiabilidade e flexibilidade. Eles podem ser configurados de duas maneiras. Eles podem ser redundantes de zona, com replicação automática entre zonas, ou zonais, com instâncias fixadas a uma zona específica. Você também pode combinar essas abordagens. Para obter mais informações sobre arquitetura zonal versus arquitetura com redundância de zona, consulte Recomendações para usar zonas e regiões de disponibilidade.

Os Hubs de Eventos implementam mecanismos transparentes de deteção de falhas e failover para que, quando ocorrer falha, o serviço continue a operar dentro dos níveis de serviço garantidos e sem interrupções percetíveis. Se você criar um namespace de Hubs de Eventos em uma região que ofereça suporte a zonas de disponibilidade, a redundância de zona será habilitada automaticamente. Com a redundância de zona, a tolerância a falhas é aumentada e o serviço tem reservas de capacidade suficientes para lidar com a interrupção de uma instalação inteira. Os metadados e os dados (eventos) são replicados entre centros de dados em cada zona.

Pré-requisitos

O suporte à zona de disponibilidade só está disponível em regiões do Azure com zonas de disponibilidade.

Criar um recurso com zonas de disponibilidade ativadas

Quando você usa o portal do Azure, a redundância de zona é habilitada automaticamente. Ao criar um namespace, você verá a seguinte mensagem realçada quando seleciona uma região que oferece suporte a zonas de disponibilidade.

Captura de tela mostrando a página Criar namespace com uma região que tem zonas de disponibilidade.

Desativar zonas de disponibilidade

O portal do Azure não suporta a desativação de zonas de disponibilidade. Para desativar as zonas de disponibilidade, use um dos seguintes métodos:

Migração da zona de disponibilidade

Quando você cria zonas de disponibilidade em uma região que oferece suporte a elas, as zonas de disponibilidade são habilitadas automaticamente. Se desejar saber como mover seu Hub de Eventos para uma nova região que ofereça suporte a zonas de disponibilidade, consulte Realocar Hubs de Eventos para outra região.

Preços

Precisa de informações. Alguma consideração de preço ao usar zonas de disponibilidade?

Recuperação de desastres entre regiões e continuidade de negócios

A recuperação de desastres (DR) consiste na recuperação de eventos de alto impacto, como desastres naturais ou implantações com falha que resultam em tempo de inatividade e perda de dados. Independentemente da causa, a melhor solução para um desastre é um plano de DR bem definido e testado e um design de aplicativo que suporte ativamente a DR. Antes de começar a pensar em criar seu plano de recuperação de desastres, consulte Recomendações para projetar uma estratégia de recuperação de desastres.

Quando se trata de DR, a Microsoft usa o modelo de responsabilidade compartilhada. Em um modelo de responsabilidade compartilhada, a Microsoft garante que a infraestrutura de linha de base e os serviços da plataforma estejam disponíveis. Ao mesmo tempo, muitos serviços do Azure não replicam dados automaticamente ou recorrem de uma região com falha para replicação cruzada para outra região habilitada. Para esses serviços, você é responsável por configurar um plano de recuperação de desastres que funcione para sua carga de trabalho. A maioria dos serviços executados nas ofertas de plataforma como serviço (PaaS) do Azure fornecem recursos e orientação para dar suporte à DR e você pode usar recursos específicos do serviço para dar suporte à recuperação rápida para ajudar a desenvolver seu plano de DR.

O modelo de cluster de Hubs de Eventos do Azure totalmente ativo com suporte à zona de disponibilidade fornece resiliência contra interrupções de hardware e datacenter. No entanto, se um desastre em que uma região inteira e todas as zonas não estiverem disponíveis, você poderá usar a recuperação de desastres geográficos para recuperar sua carga de trabalho e a configuração do aplicativo.

Há dois recursos que fornecem recuperação de desastres geográficos nos Hubs de Eventos do Azure.

  • Recuperação de desastres geográficos (Metadata DR), que apenas fornece replicação de metadados.

    A recuperação de desastres geográficos garante que toda a configuração de um namespace (Hubs de Eventos, Grupos de Consumidores e configurações) seja replicada continuamente de um namespace primário para um namespace secundário quando emparelhado.

    O recurso de recuperação de desastres geográficos dos Hubs de Eventos do Azure é uma solução de recuperação de desastres. Os conceitos e o fluxo de trabalho descritos neste artigo aplicam-se a cenários de desastre e não a interrupções temporárias. Para obter uma discussão detalhada sobre recuperação de desastres no Microsoft Azure, consulte este artigo.

    Com a recuperação de desastres geográficos, você pode iniciar uma mudança de failover única do primário para o secundário a qualquer momento. A movimentação de failover aponta o nome de alias escolhido para o namespace para o namespace secundário. Após a mudança, o emparelhamento é então removido. O failover é quase instantâneo uma vez iniciado.

    Para obter informações detalhadas, bem como exemplos e documentação adicional, sobre a recuperação de desastres geográficos em Hubs de Eventos, consulte Hubs de Eventos do Azure - Recuperação de desastres geográficos.

  • A replicação geográfica (visualização pública), que fornece replicação de metadados e dados, replica informações de configuração e todos os dados de um namespace primário para um ou mais namespaces secundários. Quando um failover é executado, o secundário selecionado torna-se o primário e o primário anterior torna-se secundário. Os usuários podem executar um failover de volta ao primário original quando desejado.

    Para obter informações detalhadas, bem como exemplos e documentação adicional, sobre a replicação geográfica em Hubs de Eventos, consulte Geo-replicação .

Próximos passos