O software de análise SAS fornece um conjunto de serviços e ferramentas para extrair insights de dados e tomar decisões inteligentes. As soluções SAS fornecem análise, inteligência artificial, inteligência de negócios, inteligência de clientes, gerenciamento de dados e inteligência de fraude e segurança.
Se você estiver implantando o SAS Grid no Azure, o Azure NetApp Files será uma opção viável de armazenamento principal. Com os serviços escaláveis do Azure NetApp Files, você pode aumentar ou diminuir as alocações de armazenamento a qualquer momento, sem interrupção dos serviços. Também é possível ajustar o nível de serviço de armazenamento aos requisitos de desempenho dinamicamente.
A SAS oferece essas plataformas primárias, que a Microsoft validou:
- Grade SAS 9.4
- SAS Viya
O SAS Grid 9.4 foi validado no Linux.
Este artigo fornece informações gerais para executar o SAS Grid 9.4 no Azure, usando o Azure NetApp Files para armazenamento SASDATA. Ele também fornece orientação sobre opções de armazenamento para SASWORK. Essas diretrizes presumem que você hospede sua própria solução SAS no Azure em seu próprio locatário. O SAS não fornece hospedagem para o SAS Grid no Azure.
Arquitetura
Baixe um arquivo do PowerPoint de todos os diagramas neste artigo.
Fluxo de dados
A camada de cálculo usa volumes SASDATA (e, opcionalmente, SASWORK) para compartilhar dados na grade. SASDATA é um volume conectado a NFS no Azure NetApp Files.
- Um nó de cálculo lê os dados de entrada de SASDATA e grava os resultados de volta em SASDATA.
- Uma parte subsequente do trabalho de análise pode ser executada por outro nó na camada de cálculo. O mesmo procedimento é usado para obter e armazenar as informações que devem ser processadas.
Possíveis casos de uso
Uma implantação escalável do SAS Grid que usa o Azure NetApp Files é aplicável a estes casos de uso:
- Análise financeira
- Detecção de fraude
- Rastreamento e proteção de espécies ameaçadas de extinção
- Ciência e medicina
- Análise e IA
Requisitos de desempenho de armazenamento
Para implantações do SAS 9.4 (SAS Grid ou SAS Analytics Pro) no Azure, o Azure NetApp Files é uma opção viável de armazenamento principal para clusters do SAS Grid de tamanho limitado. O SAS recomenda uma taxa de transferência de 100 MiB/s por núcleo físico. Dada essa recomendação, os clusters do SAS Grid que usam um volume de Azure NetApp Files para SASDATA (arquivos de dados SAS persistentes) são escaláveis para 32 a 48 núcleos físicos em duas ou mais máquinas virtuais do Azure. Os tamanhos de cluster do SAS são baseados na restrição de arquitetura de um único namespace SASDATA por cluster do SAS e na largura de banda de volume único disponível do Azure NetApp Files. A orientação sobre contagem de núcleos será revista conforme a infraestrutura do Azure (cálculo, rede e largura de banda de armazenamento por sistema de arquivos) aumentar com o tempo.
Tipos de volume do Azure NetApp Files
O Azure NetApp Files oferece dois tipos diferentes de volumes para cargas de trabalho de armazenamento anexado à rede (NAS).
Os volumes regulares fornecem:
- Até 4.500 MiB/s de leituras.
- Até 1.500 MiB/s de gravações.
- 460.000 operações de entrada/saída por segundo (IOPS).
- Até 100 TiB de capacidade total.
- Tamanho mínimo de 100 GiB.
Grandes volumes, que atingiram a disponibilidade geral em maio de 2024, fornecem:
- Até 10.000 GiB/s de taxa de transferência.
- Até 800.000 IOPS.
- 1.000 TiB de capacidade total.
- Capacidade mínima de 50 TiB.
Para saber mais, confira Requisitos e considerações para grandes volumes.
Expectativas de desempenho de volume regular do Azure NetApp Files
Um único volume regular do Azure NetApp Files pode lidar com aproximadamente 4.500 MiB/s de leituras e 1.500 MiB/s de gravações. Devido a um tipo de instância do Azure com largura de banda de saída suficiente, uma única máquina virtual (VM) pode consumir toda a largura de banda de gravação de um único volume regular do Azure NetApp Files. No entanto, somente a maior VM única disponível no Azure pode consumir toda a largura de banda de leitura de um único volume. Se você quer mais largura de banda para a carga de trabalho, considere usar um grande volume do Azure NetApp Files.
SASDATA, a principal carga de trabalho compartilhada do SAS 9.4, tem uma taxa de leitura/gravação de 80:20. Os números importantes por volume para uma carga de trabalho 80:20 com 64 KiB de leitura/gravação são:
- 2.400 MiB/s de taxa de transferência de leitura e 600 MiB/s de taxa de transferência de gravação executados simultaneamente. A taxa de transferência combinada é de cerca de 3.000 MiB/s.
Para obter mais informações, confira Referências de desempenho do Azure NetApp Files para Linux.
Desempenho de grandes volumes para o SAS Grid
Um único grande volume do Azure NetApp Files pode lidar com até 10 GiB/s de taxa de transferência total, o que significa que o potencial de desempenho do SAS Grid pode ser muito maior quando você lida com escalas maiores.
A tabela a seguir mostra os resultados de desempenho de cargas de trabalho que usam o SAS Grid em um grande volume do Azure NetApp Files com vários exemplos de tamanho de VM. A lista de exemplos contém contagens de instâncias, threads por instância e nconnect
valores que usam o Red Hat Enterprise Linux (RHEL) 8.4.
Instância de VM | Contagem de instâncias | Threads por instância | nconnect valor |
MiB/s de leitura por thread | MiB/s de gravação por thread | Total de MiB/s de leitura | Total de MiB/s de gravação |
---|---|---|---|---|---|---|---|
E32s_v5 | 1 | 16 | 8 | 465 | 113 | 7\.440 | 1.808 |
E32s_v5 | 2 | 16 | 8 | 411 | 113 | 13.152 | 3.616 |
E32s_v5 | 3 | 16 | 8 | 223 | 113 | 10.704 | 5.424 |
E32s_v5 | 6 | 16 | 8 | 117 | 107 | 11.232 | 10.272 |
E104id_v5 | 1 | 52 | 8 | 161 | 47 | 8.372 | 2.444 |
E104id_v5 | 1 | 52 | 16 | 192 | 50 | 9.984 | 2.600 |
Observação
Se você precisar de mais desempenho para seus volumes SASDATA ou SASWORK, use grandes volumes do Azure NetApp Files. Para saber mais, confira Requisitos e considerações para grandes volumes.
Recomendações de capacidade
A calculadora de desempenho do Azure NetApp Files pode fornecer orientação para dimensionar volumes SASDATA.
É importante escolher um nível de serviço apropriado porque:
- A largura de banda do volume é baseada na capacidade do volume.
- O custo da capacidade é baseado no nível de serviço.
- A escolha de nível de serviço é baseada nas necessidades de capacidade versus largura de banda.
Na calculadora, selecione avançado, selecione uma região e insira os seguintes valores.
- Tamanho do volume: capacidade desejada
- Taxa de transferência: taxa de transferência desejada, considerando 100 MiB/s por núcleo
- Porcentagem de leitura: 80%
- IOPS: 0
- Tamanho de E/S: sequencial de 64 KiB
A saída na parte inferior da tela fornece os requisitos de capacidade recomendados em cada nível de serviço e o custo por mês, com base no preço da região selecionada:
- Taxa de transferência. A largura de banda do volume, com base na combinação de carga de trabalho. Para uma carga de trabalho de leitura sequencial de 64 KiB de 80%, 3.096 MiB/s é o máximo esperado.
- IOPS. O número de IOPS que o volume fornece na taxa de transferência especificada.
- Tamanho do volume. A quantidade de capacidade exigida pelo volume nos níveis de serviço especificados para atingir a taxa de transferência necessária. A capacidade de volume (relatada em GiBs) pode ser igual ou menor que o tamanho do pool de capacidade. Essa recomendação presume que você está usando tipos de pool de capacidade de QoS automáticos. Para otimizar ainda mais a distribuição de capacidade versus taxa de transferência entre volumes em um pool de capacidade, considere os tipos de pool de capacidade de QoS manual.
- Tamanho do pool de capacidade. O tamanho do pool. A capacidade de um volume é definida em um pool de capacidade. Os pools de capacidade são dimensionados em incrementos de 1 TiB.
- Custo do pool de capacidade (US$/mês). O custo por mês do pool de capacidade no tamanho e nível de serviço determinados.
- Retorno de exibição de volume (US$/mês). O custo por mês da capacidade do volume na capacidade especificada. Os encargos são baseados nos tamanhos de pool de capacidade alocada. O retorno de exibição de volume indica a quantidade de volume.
Observação
A experiência do usuário é a mesma, independentemente do nível de serviço, desde que seja provisionada largura de banda suficiente.
Controle os custos conforme necessário usando a modelagem de volume no Azure NetApp Files. Duas opções dinâmicas estão disponíveis para influenciar o desempenho e o custo:
- Redimensionar dinamicamente um pool de volume e capacidade
- Alterar dinamicamente o nível de serviço de um volume
Saiba mais sobre o modelo de custo do Azure NetApp Files.
Proteção de dados
O Azure NetApp Files usa instantâneos para ajudar você a proteger seus dados. Os instantâneos fornecem imagens quase instantâneas, consistentes com falhas e eficientes em termos de espaço dos volumes do Azure NetApp Files. Você pode criar instantâneos manualmente a qualquer momento ou programá-los usando uma política de instantâneo no volume.
Use uma política de instantâneo para adicionar proteção de dados automatizada aos seus volumes. Você pode restaurar instantâneos no local rapidamente usando a reversão de instantâneo. Ou você pode restaurar um instantâneo para um novo volume para recuperação rápida de dados. Você também pode usar a função de restauração para novo volume para fornecer ambientes de teste/desenvolvimento com dados atuais.
Para obter níveis adicionais de proteção de dados, use soluções de proteção de dados que usam o backup do Azure NetApp Files ou o software de backup de parceiros.
Componentes
Máquinas Virtuais do Azure: o SAS Grid requer alta memória, armazenamento e largura de banda de E/S, em uma proporção apropriada com o número de núcleos. O Azure oferece tamanhos de máquina virtual (VM) predefinidos com contagens de vCPU mais baixas que podem ajudar a equilibrar o número de núcleos necessários com a quantidade de memória, armazenamento e largura de banda de E/S.
Para obter mais informações, consulte Tamanhos restritos de VM compatíveis com vCPU. É importante entender completamente quais recursos de cálculo estão disponíveis em cada instância. Para executar o SAS Grid no Azure com o Azure NetApp Files, recomendamos estes tipos de instância:
- Standard_E64-16ds_v4 ou Standard_E64-16ds_v5
- Standard_E64-32ds_v4 ou Standard_E64-32ds_v5
Revise as práticas recomendadas para usar o SAS no Azure, incluindo as atualizações nos comentários.
Azure NetApp Files: você pode armazenar SASDATA em um volume de Azure NetApp Files, compartilhado no cluster de cálculo.
Se desejar, você também pode usar volumes NFS do Azure NetApp Files para SASWORK.
O Azure NetApp Files está disponível em três níveis de serviço de desempenho:
- Standard
- Premium
- Ultra
O desempenho do volume é definido principalmente pelo nível de serviço. O tamanho do volume também é um fator, pois a taxa de transferência obtida é determinada pelo nível de serviço e pelo tamanho do volume.
Opções de armazenamento para SASDATA
Como o Azure NetApp Files pode fornecer acesso de alta taxa de transferência e baixa latência ao armazenamento, ele é uma alternativa viável e mais rápida ao Disco Premium. O armazenamento conectado à rede não é limitado no nível da VM como acontece com os discos gerenciados e, portanto, você obtém maior taxa de transferência para o armazenamento.
Para estimar a camada necessária para sua capacidade SASDATA, use a Calculadora de Desempenho do Azure NetApp Files. (Selecione Avançado.)
Como os volumes NFS do Azure NetApp Files são compartilhados, eles são bons candidatos para hospedar o SASDATA, quando usados com os tipos de instância de VM dimensionados corretamente e a distribuição RHEL, tópicos discutidos posteriormente neste artigo.
Opções de armazenamento para SASWORK
A tabela a seguir mostra as opções de armazenamento mais comuns para implantar o SASWORK no Azure. Dependendo dos seus requisitos de tamanho (capacidade) e velocidade (largura de banda), você tem três opções: armazenamento temporário, disco gerenciado e Azure NetApp Files.
Armazenamento temporário | Disco gerenciado | Azure NetApp Files | |
---|---|---|---|
Tamanho | Pequeno | grande | Extragrande |
Velocidade | Extragrande | Small | Médio |
Faça estas considerações ao escolher uma opção:
- O armazenamento temporário (ou armazenamento efêmero) fornece a maior largura de banda, mas está disponível apenas em tamanhos menores. (O tamanho depende do SKU da VM.) Dependendo das capacidades disponíveis e necessárias, essa opção pode ser a melhor.
- Se a capacidade de SASWORK necessária exceder o tamanho de armazenamento temporário do SKU da VM selecionado, use um disco gerenciado do Azure para hospedar o SASWORK. No entanto, a taxa de transferência para um disco gerenciado é limitada pela arquitetura da VM por design e varia dependendo do SKU da VM. Portanto, essa opção de armazenamento é viável apenas para ambientes que têm requisitos de desempenho SASWORK mais baixos.
- Para obter os requisitos de capacidade de SASWORK mais altos e um requisito de desempenho médio além do que os discos gerenciados do Azure podem fornecer, considere o Azure NetApp Files para SASWORK. Ele fornece um tamanho grande e uma taxa de transferência rápida.
Importante
Em qualquer cenário, lembre-se de que o SASWORK não pode ser compartilhado entre nós de cálculo de VM. Você precisa criar volumes de SASWORK separados para cada nó de cálculo. Os volumes precisam ser montados em NFS em apenas um nó de cálculo.
Ao usar a tabela anterior, para decidir se suas necessidades são pequenas, grandes, médias ou extragrandes, leve em consideração a escala da implantação, o número de VMs e núcleos e os requisitos de capacidade e desempenho associados. Você precisa fazer essas avaliações para cada implantação.
As opções na tabela correspondem às implantações descritas nas arquiteturas a seguir. Em todos os cenários, o SASDATA é hospedado em um volume NFS do Azure NetApp Files e compartilhado entre os nós de cálculo. Para algumas distribuições RHEL, recomendamos usar a opção NFS nconnect para criar vários fluxos de rede para o volume. Para saber mais, consulte a seção Opções de montagem em NFS deste artigo.
Arquitetura de armazenamento temporário
Para requisitos de capacidade menor do SASWORK, o armazenamento temporário da VM do Azure é uma solução rápida e econômica. Nessa arquitetura, cada VM na camada de cálculo é equipada com algum armazenamento temporário. Para determinar os tamanhos de armazenamento temporário para as VMs usadas, consulte a documentação da VM do Azure.
Fluxo de dados
- Um nó de cálculo lê os dados de entrada de SASDATA e grava os resultados de volta em SASDATA.
- Uma parte subsequente do trabalho de análise pode ser executada por outro nó na camada de cálculo. O mesmo procedimento é usado para obter e armazenar as informações que devem ser processadas.
- O diretório de trabalho temporário SASWORK não é compartilhado. Ele é armazenado temporariamente em cada nó de cálculo.
Arquitetura de disco gerenciado
Se seus requisitos de capacidade para SASWORK excederem as capacidades disponíveis no armazenamento temporário, os discos gerenciados do Azure serão uma boa alternativa. Os discos gerenciados estão disponíveis em vários tamanhos e níveis de desempenho. Para obter mais informações, confira Escalabilidade e metas de desempenho dos discos de VM.
Fluxo de dados
- Um nó de cálculo lê os dados de entrada de SASDATA e grava os resultados de volta em SASDATA.
- Uma parte subsequente do trabalho de análise pode ser executada por outro nó na camada de cálculo. O mesmo procedimento é usado para obter e armazenar as informações que devem ser processadas.
- O diretório de trabalho temporário SASWORK não é compartilhado. Ele é armazenado em discos gerenciados que são anexados a cada nó de cálculo.
Arquitetura do Azure NetApp Files
Para obter requisitos de capacidade de SASWORK mais alta ou desempenho médio, use o Azure NetApp Files. O Azure NetApp Files fornece capacidades de volume de até 100 TiB com um volume regular e 1 PiB com um volume grande. Cada nó na camada de cálculo deve ter seu próprio volume SASWORK. Os volumes não devem ser compartilhados.
Fluxo de dados
- Um nó de cálculo lê os dados de entrada de SASDATA e grava os resultados de volta em SASDATA.
- Uma parte subsequente do trabalho de análise pode ser executada por outro nó na camada de cálculo. O mesmo procedimento é usado para obter e armazenar as informações que devem ser processadas.
- O diretório de trabalho temporário SASWORK não é compartilhado. Ele é armazenado em volumes individuais do Azure NetApp Files anexados a cada nó de cálculo.
Recomendações de escala e configuração
- Para obter a melhor e mais consistente latência para o tráfego de dados entre as instâncias no cluster SAS, verifique se todas as VMs são criadas no mesmo grupo de posicionamento por proximidade.
- Revise a seção Diretrizes gerais de ajuste em Práticas recomendadas para usar SAS no Azure.
- Para obter a largura de banda de rede ideal, habilite a Rede Acelerada.
Distribuições RHEL e configurações NFS
Distribuições RHEL
RHEL é a distribuição recomendada para executar o SAS 9 no Linux. Cada kernel com suporte da Red Hat tem suas próprias restrições de largura de banda NFS.
Para obter detalhes sobre como executar SAS no Azure, consulte Práticas recomendadas para usar SAS no Azure.
As VMs Standard_E64-16ds_v4 e Standard_E64-32ds_v4 do Azure, ou seus equivalentes v5, são recomendadas para SAS. Levando essas recomendações em consideração, esta seção fornece algumas diretrizes para usar o SAS com o Azure NetApp Files.
Se você usa o RHEL 7, Standard_E64-16ds_v4 ou Standard_E64-16ds_v5 é a melhor escolha, com base na meta de 100 MiB/s por núcleo físico para SASDATA.
- Standard_E64-16ds_v4: 90–100 MiB/s por núcleo
- Standard_E64-32ds_v4: 45-50 MiB/s por núcleo
Se você usa o RHEL 8.2, Standard_E64-16ds_v4 ou Standard_E64-32ds_v4, ou seus equivalentes v5, são opções possíveis. Standard_E64-16ds_v4 é preferível, dado a meta de 100 MiB/s por núcleo para SASDATA.
- Standard_E64-16ds_v4: 150-160 MiB/s por núcleo
- Standard_E64-32ds_v4: 75-80 MiB/s por núcleo
Se você usa o RHEL 8.3, Standard_E64-16ds_v4 e Standard_E64-32ds_v4, ou seus equivalentes v5, serão totalmente aceitáveis, considerando a meta de taxa de transferência por núcleo:
- A validação indica 3.200 MiB/s de leituras.
- Esses resultados são obtidos com a opção de
nconnect
montagem em NFS.
O teste mostra que uma única instância do RHEL 7 não alcança mais do que aproximadamente 750-800 MiB/s de taxa de transferência de leitura em um único ponto de extremidade de armazenamento do Azure NetApp Files (ou seja, em um soquete de rede). 1.500 MiB/s de gravações podem ser alcançados no mesmo ponto de extremidade, se você usar opções de 64 KiB rsize
e wsize
de montagem em NFS. Algumas evidências sugerem que a máxima taxa de transferência de leitura observada anteriormente é um artefato do kernel 3.10. Para mais informações, consulte RHEL CVE-2019-11477.
O teste mostra que uma única instância do RHEL 8.2, com o kernel 4.18, está livre das limitações observadas no kernel 3.10. Assim, 1.200-1.300 MiB/s de tráfego de leitura é alcançável, se você usar uma opção de 64 KiB rsize
e wsize
de montagem em NFS. Para gravações sequenciais grandes, você pode esperar os mesmos 1.500 MiB/s de taxa de transferência alcançável que você obteria no RHEL 7.
Com uma única instância do RHEL 8.3, com a opção de montagem nconnect (que é nova na distribuição do RHEL 8.3), cerca de 3.200 MiB/s de taxa de transferência de leitura é possível a partir de um único volume do Azure NetApp Files. Não espere mais de 1.500 MiB/s de gravações em um único volume do Azure NetApp Files, mesmo quando você aplicar nconnect
.
Ajustáveis do kernel
Entradas da tabela de slots
O NFSv3 não tem um mecanismo para negociar a simultaneidade entre o cliente e o servidor. O cliente e o servidor definem seus limites sem consultar o outro. Para obter o melhor desempenho, alinhe o número máximo de entradas da tabela de slots sunrpc
do lado do cliente com aquelas compatíveis sem recusa no servidor. Quando um cliente sobrecarrega a capacidade da pilha de rede do servidor de processar uma carga de trabalho, o servidor responde a isso diminuindo o tamanho da janela para a conexão, o que não é ideal para desempenho.
Por padrão, os kernels Linux modernos definem o tamanho sunrpc
de entrada da tabela de slot por conexão sunrpc.max_tcp_slot_table_entries
para suportar 65.536 operações pendentes. Essas entradas da tabela de slots definem os limites de simultaneidade. Valores tão altos são desnecessários porque o Azure NetApp Files tem como padrão 128 operações pendentes.
Recomendamos que você ajuste o cliente para o mesmo número:
- Ajustáveis do kernel (via /etc/sysctl.conf)
sunrpc.tcp_max_slot_table_entries=128
Ajustáveis de cache do sistema de arquivos
Você também precisa entender os seguintes fatores sobre os ajustáveis de cache do sistema de arquivos:
- A liberação de um buffer sujo deixa os dados em um estado limpo para leituras futuras até que a pressão de memória leve à remoção.
- Há três gatilhos para uma operação de liberação assíncrona:
- Baseado no tempo: quando um buffer atinge a idade definida pelo ajustável vm.dirty_expire_centisecs ou vm.dirty_writeback_centisecs, ele deve ser marcado para limpeza (ou seja, descarga ou gravação no armazenamento).
- Pressão de memória: para obter detalhes, consulte vm.dirty_ratio | vm.dirty_bytes.
- Fechamento: quando um identificador de arquivo é fechado, todos os buffers sujos são liberados de forma assíncrona para o armazenamento.
Esses fatores são controlados por quatro ajustáveis. Você pode ajustar cada ajustável dinâmica e persistentemente usando tuned
ou sysctl
no arquivo /etc/sysctl.conf. O ajuste dessas variáveis melhora o desempenho do SAS Grid:
- Ajustáveis do kernel (via perfil ajustado personalizado)
include = throughput-performance
vm.dirty_bytes = 31457280
vm.dirty_expire_centisecs = 100
vm.dirty_writeback_centisecs = 300
Opções de montagem em NFS
Recomendamos as seguintes opções de montagem em NFS para sistemas de arquivos compartilhados NFS que são usados para arquivos SASDATA permanentes:
RHEL 7 e 8.2
bg,rw,hard,rsize=65536,wsize=65536,vers=3,noatime,nodiratime,rdirplus,acdirmin=0,tcp,_netdev
RHEL 8.3
bg,rw,hard,rsize=65536,wsize=65536,vers=3,noatime,nodiratime,rdirplus,acdirmin=0,tcp,_netdev,nconnect=8
Recomendamos as seguintes opções de montagem para volumes SASWORK, onde os respectivos volumes são usados exclusivamente para SASWORK e não compartilhados entre nós:
RHEL 7 e 8.2
bg,rw,hard,rsize=65536,wsize=65536,vers=3,noatime,nodiratime,rdirplus,acdirmin=0,tcp,_netdev,nocto
RHEL 8.3
bg,rw,hard,rsize=65536,wsize=65536,vers=3,noatime,nodiratime,rdirplus,acdirmin=0,tcp,_netdev,nocto,nconnect=8
Para obter mais informações sobre os benefícios e o custo da opção de montagem nocto
, consulte Consistência de fechamento para abertura e temporizadores de atributo de cache.
Você também deve revisar Azure NetApp Files: um sistema de arquivos compartilhado para usar com o SAS Grid no MS Azure, incluindo todas as atualizações nos comentários.
Configurações de leitura antecipada do NFS
Recomendamos que você defina o ajustável de leitura antecipada do NFS para todas as distribuições RHEL como 15.360 KiB. Para obter mais informações, consulte Como definir persistentemente a leitura antecipada para montagens em NFS.
Alternativas
A solução de armazenamento nas arquiteturas anteriores é altamente disponível, conforme especificado pelo contrato de nível de serviço do Azure NetApp Files. Para obter proteção e disponibilidade adicionais, você pode replicar os volumes de armazenamento para outra região do Azure usando a replicação entre regiões do Azure NetApp Files.
Há duas vantagens principais em replicar os volumes por meio da solução de armazenamento:
- Não há carga adicional nas VMs do aplicativo.
- Essa solução elimina a necessidade de executar VMs na região de destino durante a operação normal.
O conteúdo de armazenamento é replicado sem o uso de nenhum recurso de infraestrutura de cálculo, e a região de destino não precisa executar o software SAS. As VMs de destino não precisam estar em execução para oferecer suporte a esse cenário.
A arquitetura a seguir mostra como o conteúdo de armazenamento no Azure NetApp Files é replicado para uma segunda região, onde o armazenamento é preenchido com uma réplica dos dados de produção. Se houver um failover, a região secundária será colocada online e as VMs serão iniciadas para que a produção possa ser retomada na segunda região. Você precisa redirecionar o tráfego para a segunda região reconfigurando balanceadores de carga que não são mostrados no diagrama.
O RPO típico para esta solução é inferior a 20 minutos quando o intervalo de atualização de replicação entre regiões é definido como 10 minutos.
Fluxo de dados
- Um nó de cálculo lê os dados de entrada de SASDATA e grava os resultados de volta em SASDATA.
- Uma parte subsequente do trabalho de análise pode ser executada por outro nó na camada de cálculo. O mesmo procedimento é usado para obter e armazenar as informações que devem ser processadas.
- O diretório de trabalho temporário SASWORK não é compartilhado. Ele é armazenado em volumes individuais do Azure NetApp Files anexados a cada nó de cálculo.
- A replicação entre regiões do Azure NetApp Files replica de forma assíncrona o volume SASDATA, incluindo todos os instantâneos, para uma região de DR para facilitar o failover se houver um desastre regional.
Considerações
Essas considerações implementam os pilares do Azure Well-Architected Framework, um conjunto de princípios orientadores que você poderá usar para melhorar a qualidade de uma carga de trabalho. Para obter mais informações, confira Microsoft Azure Well-Architected Framework.
Confiabilidade
A confiabilidade garante que seu aplicativo possa cumprir os compromissos que você assume com seus clientes. Para obter mais informações, confira Visão geral do pilar de confiabilidade.
O Azure NetApp Files fornece um SLA padrão de disponibilidade de 99,99% para todas as camadas e todas as regiões com suporte. O Azure NetApp Files também oferece suporte a volumes de provisionamento em zonas de disponibilidade escolhidas por você e a implantações de HA entre zonas.
Para SLAs RPO/RTO aprimorados, a proteção de dados integrada com instantâneos e backup está incluída no serviço. A replicação entre regiões fornece os mesmos benefícios entre as regiões do Azure.
Segurança
A segurança fornece garantias contra ataques deliberados e o abuso de seus dados e sistemas valiosos. Para saber mais, confira Visão geral do pilar de segurança.
O Azure NetApp Files fornece um nível de segurança porque os volumes são provisionados e o tráfego de dados permanece em suas redes virtuais. Não há um ponto de extremidade endereçável publicamente. Todos os dados são criptografados em repouso o tempo todo. Se desejar, você pode criptografar dados em trânsito.
O Azure Policy pode ajudar você a impor padrões organizacionais e a avaliar a conformidade em escala. O Azure NetApp Files suporta o Azure Policy por meio de definições de política personalizadas e integradas.
Eficiência de desempenho
A eficiência do desempenho é a capacidade de dimensionar sua carga de trabalho para atender às demandas colocadas por usuários de maneira eficiente. Para obter mais informações, consulte Visão geral do pilar de eficiência de desempenho.
Desempenho
Dependendo de seus requisitos de taxa de transferência e capacidade, tenha em mente as seguintes considerações:
- As considerações de desempenho do Azure NetApp Files.
- A capacidade e os níveis de serviço necessários do Azure NetApp Files para SASDATA.
- A orientação neste artigo para escolher um tipo de armazenamento para SASWORK.
Observação
O recurso de grandes volumes do Azure NetApp Files já está disponível. Esse recurso fornece uma taxa de transferência por volume mais alta do que os volumes regulares do Azure NetApp Files. Esse recurso pode ser considerado caso seja necessário mais desempenho para seus volumes SASDATA (ou SASWORK). Confira esta documentação para saber mais detalhes.
Escalabilidade
Você pode dimensionar facilmente o desempenho de cálculo adicionando VMs aos conjuntos de escala que executam as três camadas da solução SAS.
Você pode dimensionar dinamicamente o armazenamento de volumes do Azure NetApp Files. Se você usar QoS automático, o desempenho será dimensionado ao mesmo tempo. Para um controle mais granular de cada volume, você também pode controlar o desempenho de cada volume separadamente usando QoS manual para seus pools de capacidade.
Os volumes do Azure NetApp Files estão disponíveis em três níveis de desempenho: Ultra, Premium e Standard. Escolha o nível que melhor se adapta aos seus requisitos de desempenho, levando em conta que a largura de banda de desempenho disponível é dimensionada com o tamanho de um volume. Você pode alterar o nível de serviço de um volume a qualquer momento. Para obter mais informações sobre o modelo de custo do Azure NetApp Files, consulte estes exemplos de preços.
Você pode usar a Calculadora de Desempenho do Azure NetApp Files para começar.
Otimização de custo
A otimização de custos consiste em reduzir despesas desnecessárias e melhorar a eficiência operacional. Para obter mais informações, confira Visão geral do pilar de otimização de custo.
Modelo de custo
Entender o modelo de custo do Azure NetApp Files pode ajudar você a gerenciar suas despesas.
A cobrança do Azure NetApp Files é baseada na capacidade de armazenamento provisionada, que você aloca criando pools de capacidade. Os pools de capacidade são cobrados mensalmente com base em um custo definido por GiB alocado por hora.
Se os requisitos de tamanho do pool de capacidade oscilarem (por exemplo, devido a necessidades variáveis de capacidade ou desempenho), redimensione dinamicamente seus volumes e pools de capacidade para equilibrar o custo com suas necessidades de capacidade e desempenho.
Se os requisitos de tamanho do pool de capacidade permanecerem os mesmos, mas os requisitos de desempenho flutuarem, considere alterar dinamicamente o nível de serviço de um volume. Você pode provisionar e desprovisionar pools de capacidade de diferentes tipos ao longo do mês, fornecendo desempenho just-in-time e reduzindo custos durante períodos em que você não precisa de alto desempenho.
Preços
Com base em seus requisitos de capacidade e desempenho, decida de qual nível de serviço do Azure NetApp Files você precisa (Standard, Premium ou Ultra). Em seguida, use a Calculadora de Preços do Azure para avaliar os custos desses componentes:
- Componentes do SAS no Azure
- Azure NetApp Files
- Disco gerenciado (opcionalmente)
- Rede virtual
Excelência operacional
A excelência operacional abrange os processos de operações que implantam um aplicativo e o mantêm em execução na produção. Para obter mais informações, confira Visão geral do pilar de excelência operacional.
O SAS Grid no Azure fornece flexibilidade e uma implantação rápida. Veja aqui alguns benefícios:
- Atenda às demandas de negócios em constante mudança com balanceamento dinâmico de carga de trabalho
- Criar um ambiente de computação SAS altamente disponível
- Obter resultados mais rápidos de sua infraestrutura de TI existente
- Aumentar os recursos de computação de forma incremental e econômica
- Gerenciar todas as cargas de trabalho analíticas
- Fazer a transição facilmente de um servidor em silos ou de um ambiente de vários PCs para um ambiente de grade SAS
Implantar este cenário
É melhor implantar as cargas de trabalho usando um processo de IaC (infraestrutura como código). As cargas de trabalho SAS podem ser sensíveis a configurações incorretas que geralmente ocorrem em implantações manuais e reduzem a produtividade.
Para começar a projetar sua solução SAS Grid no Azure, revise SAS na Arquitetura do Azure e Automatizar a implantação de SAS no Azure usando as Ações do GitHub.
Colaboradores
Esse artigo é mantido pela Microsoft. Ele foi originalmente escrito pelos colaboradores a seguir.
Principais autores:
- Geert van Teylingen | Gerente de produto do grupo
- Arnt de Gier | Engenheiro técnico de marketing
Outros colaboradores:
- Mick Alberts | Escritor Técnico
Para ver perfis não públicos do LinkedIn, entre no LinkedIn.
Próximas etapas
- Webinar de início rápido sobre como começar a usar o Azure
- Azure NetApp Files: um sistema de arquivos compartilhado a ser usado com o SAS Grid no Azure
- Calculadora de Desempenho de Azure NetApp Files
- Documentação do Azure NetApp Files
- Treinamento: Introdução ao Azure NetApp Files
- Requisitos e considerações para grandes volumes