Este artigo descreve como usar o Precisely Connect para migrar sistemas de mainframe e midrange para o Azure.
Apache®, Spark e o logotipo flame são marcas registradas ou marcas comerciais da Apache Software Foundation nos Estados Unidos e/ou em outros países. Nenhum endosso da Apache Software Foundation está implícito no uso dessas marcas.
Arquitetura
Transfira um ficheiro do Visio desta arquitetura.
Fluxo de Trabalho
- Um componente do agente Connect captura logs de alterações usando utilitários nativos de mainframe ou midrange e armazena em cache os logs no armazenamento temporário.
- Para sistemas de mainframe, um componente de editor no mainframe gerencia a migração de dados.
- Para sistemas midrange, no lugar do editor, um componente ouvinte gerencia a migração de dados. Ele está localizado em uma máquina Windows ou Linux.
- O editor ou ouvinte move os dados do local para o Azure por meio de uma conexão de segurança aprimorada. O editor ou ouvinte lida com a confirmação e reversão de transações para cada unidade de trabalho, mantendo a integridade dos dados.
- O Connect Replicator Engine captura os dados do editor ou ouvinte e os aplica ao destino. Distribui dados para processamento paralelo.
- O destino é um banco de dados que recebe as alterações via ODBC ou ingere as alterações por meio dos Hubs de Eventos do Azure.
- Os dados alterados são consumidos pelo Azure Databricks e aplicados aos serviços da plataforma de dados do Azure.
- O Daemon do Connect Controller autentica a solicitação e estabelece a conexão de soquete entre o editor ou ouvinte e o Replicator Engine.
Componentes
Networking e identidade
- O Azure ExpressRoute estende suas redes locais para a plataforma de nuvem do Azure por meio de uma conexão privada de um provedor de conectividade.
- O Gateway de VPN do Azure permite criar gateways de rede virtual que enviam tráfego criptografado entre uma rede virtual do Azure e um local local pela Internet pública.
- O Microsoft Entra ID é um serviço de gerenciamento de identidade e acesso que sincroniza com o Ative Directory local.
Armazenamento
- O Banco de Dados SQL do Azure faz parte da família SQL do Azure. Ele foi criado para a nuvem e oferece todos os benefícios de uma plataforma como serviço (PaaS) totalmente gerenciada e perene. O Banco de Dados SQL também fornece recursos automatizados baseados em IA que otimizam o desempenho e a durabilidade. As opções de computação sem servidor e armazenamento Hyperscale dimensionam automaticamente os recursos sob demanda.
- O Banco de Dados do Azure para PostgreSQL é um serviço de banco de dados relacional totalmente gerenciado baseado na edição da comunidade do mecanismo de banco de dados PostgreSQL de código aberto.
- O Banco de Dados do Azure para MySQL é um serviço de banco de dados relacional totalmente gerenciado baseado na edição da comunidade do mecanismo de banco de dados MySQL de código aberto.
- A Instância Gerenciada SQL do Azure é um serviço de banco de dados em nuvem inteligente e escalável que oferece todos os benefícios de um PaaS totalmente gerenciado e perene. A Instância Gerenciada SQL tem quase 100% de compatibilidade com o mecanismo de banco de dados SQL Server Enterprise Edition mais recente. Ele também fornece uma implementação de rede virtual nativa que aborda preocupações comuns de segurança.
- O Azure Synapse Analytics é um armazém de dados na nuvem rápido e flexível que o ajuda a dimensionar, calcular e armazenar de forma elástica e independente, com uma arquitetura de processamento paralelo massivo.
- O Armazenamento do Azure é uma solução de armazenamento em nuvem que inclui armazenamento de objetos, ficheiros, discos, filas e tabelas. Os serviços incluem soluções de armazenamento híbrido e ferramentas para transferência, compartilhamento e backup de dados.
Análise e relatórios
- O Power BI é um conjunto de ferramentas de análise de negócios que pode fornecer informações em toda a sua organização. Usando o Power BI, você pode se conectar a centenas de fontes de dados, simplificar a preparação de dados e conduzir análises ad hoc.
Monitorização
- O Azure Monitor fornece uma solução abrangente para coletar, analisar e agir em telemetria de ambientes locais e na nuvem. Os recursos incluem Application Insights, Azure Monitor Logs, e Log Analytics.
Integradores de dados
- O Precisamente Connect pode integrar dados de várias fontes e fornecer replicação em tempo real para o Azure. Você pode usá-lo para replicar dados sem fazer alterações em seu aplicativo. O Connect também pode melhorar o desempenho de trabalhos de extração, transformação e carregamento (ETL).
- O Azure Databricks é baseado no Apache Spark e integra-se com bibliotecas de código aberto. Ele fornece uma plataforma unificada para executar cargas de trabalho de análise. Você pode usar as linguagens Python, Scala, R e SQL para enquadrar pipelines ETL e orquestrar trabalhos.
- Os Hubs de Eventos do Azure são um serviço de ingestão em tempo real que pode processar milhões de registros por segundo. Você pode ingerir dados de várias fontes e usá-los para análises em tempo real. Você pode dimensionar facilmente Hubs de Eventos com base no volume de dados.
Detalhes do cenário
Você pode usar várias estratégias para migrar sistemas de mainframe e midrange para o Azure. A migração de dados desempenha um papel fundamental neste processo. Em uma arquitetura de nuvem híbrida, os dados precisam ser replicados entre sistemas de mainframe ou midrange e a plataforma de dados do Azure. Para manter a integridade dos dados, você precisa de replicação em tempo real para aplicativos críticos para os negócios. O Precisely Connect pode ajudá-lo a replicar dados de fontes de dados de mainframe e midrange para a plataforma de dados do Azure em tempo real usando a captura de dados de alteração (CDC) ou a ingestão em lote.
O Precisely Connect suporta várias fontes de dados de mainframe e midrange, incluindo Db2 z/OS, Db2 LUW, Db2 for i, IMS, VSAM, arquivos e copybooks. Ele os migra para destinos do Azure, como Banco de Dados SQL, Banco de Dados do Azure para PostgreSQL, Banco de Dados do Azure para MySQL, Armazenamento do Azure Data Lake e Azure Synapse Analytics, sem afetar os aplicativos. Ele também suporta escalabilidade com base no volume de dados e nos requisitos do cliente. Ele replica dados sem afetar o desempenho ou sobrecarregar a rede.
Potenciais casos de utilização
Esta solução aplica-se aos seguintes cenários:
- Replicação de dados de fontes de dados de mainframe e midrange para a plataforma de dados do Azure.
- Em uma arquitetura de nuvem híbrida, os dados sincronizam entre sistemas mainframe ou midrange e a plataforma de dados do Azure.
- Análise quase em tempo real no Azure, com base em dados operacionais de sistemas mainframe ou midrange.
- Migração de dados de sistemas mainframe ou midrange para o Azure sem afetar aplicativos.
Considerações
Essas considerações implementam os pilares do Azure Well-Architected Framework, um conjunto de princípios orientadores que você pode usar para melhorar a qualidade de uma carga de trabalho. Para obter mais informações, consulte Microsoft Azure Well-Architected Framework.
Fiabilidade
A confiabilidade garante que seu aplicativo possa atender aos compromissos que você assume com seus clientes. Para obter mais informações, consulte Visão geral do pilar de confiabilidade.
Use o Azure Monitor e o Application Insights para monitorar sua migração de dados. Configure alertas para gerenciamento proativo. Para obter mais informações sobre confiabilidade no Azure, consulte Projetando aplicativos confiáveis do Azure.
Otimização de custos
A otimização de custos consiste em reduzir despesas desnecessárias e melhorar a eficiência operacional. Para obter mais informações, consulte Visão geral do pilar de otimização de custos.
- Replicar dados para o Azure e processá-los nos serviços do Azure pode ser mais econômico do que mantê-los em um sistema de mainframe.
- A ferramenta de Gestão de Custos no portal do Azure fornece uma vista de análise de custos que o pode ajudar a analisar os seus gastos.
- Você pode usar o Azure Databricks para redimensionar seu cluster com dimensionamento automático para otimizar custos. Fazer isso pode ser menos dispendioso do que usar uma configuração fixa.
- O Azure Advisor fornece recomendações para otimizar o desempenho e o gerenciamento de custos.
Use a calculadora de preços do Azure para estimar o custo de implementação dessa solução.
Eficiência de desempenho
Eficiência de desempenho é a capacidade da sua carga de trabalho para dimensionar para satisfazer as exigências que os utilizadores lhe colocam de forma eficiente. Para obter mais informações, consulte Visão geral do pilar de eficiência de desempenho.
- O Precisely Connect pode ser dimensionado com base no volume de dados e otimizar a replicação de dados.
- O Connect Replicator Engine pode distribuir dados para processamento paralelo. Você pode equilibrar a distribuição com base na ingestão de cargas de trabalho.
- O Banco de dados SQL sem servidor pode ser dimensionado automaticamente com base no volume de cargas de trabalho.
- Os Hubs de Eventos podem ser dimensionados com base nas unidades de taxa de transferência e no número de partições.
Para obter mais informações, consulte Práticas recomendadas de dimensionamento automático no Azure.
Contribuidores
Este artigo é mantido pela Microsoft. Foi originalmente escrito pelos seguintes contribuidores.
Autor principal:
- Seetharaman Sankaran - Brasil | Arquiteto de Engenharia Sénior
Outros contribuidores:
- Mick Alberts - Brasil | Redator Técnico
Para ver perfis não públicos do LinkedIn, inicie sessão no LinkedIn.
Próximos passos
- Alterar a captura de dados com o Connect
- O que é o Azure ExpressRoute?
- O que é um Gateway de VPN?
- O que é a Base de Dados SQL do Azure?
- Entre em contato com a Engenharia de Modernização de Dados de Mainframe na Microsoft