Novidades do HDInsight no AKS? (Visualização)

Observação

Desativaremos o Microsoft Azure HDInsight no AKS em 31 de janeiro de 2025. Para evitar o encerramento abrupto das suas cargas de trabalho, você precisará migrá-las para o Microsoft Fabric ou para um produto equivalente do Azure antes de 31 de janeiro de 2025. Os clusters restantes em sua assinatura serão interrompidos e removidos do host.

Apenas o suporte básico estará disponível até a data de desativação.

Importante

Esse recurso está atualmente na visualização. Os Termos de uso complementares para versões prévias do Microsoft Azure incluem mais termos legais que se aplicam aos recursos do Azure que estão em versão beta, em versão prévia ou ainda não lançados em disponibilidade geral. Para obter informações sobre essa versão prévia específica, confira Informações sobre a versão prévia do Azure HDInsight no AKS. Caso tenha perguntas ou sugestões de recursos, envie uma solicitação no AskHDInsight com os detalhes e siga-nos para ver mais atualizações sobre a Comunidade do Azure HDInsight.

No HDInsight no AKS, todas as operações e gestão de clusters têm suporte nativo para gerenciamento de serviços no portal do Azure para clusters individuais.

No HDInsight no AKS, são introduzidos dois novos conceitos:

  • Os Pools de Cluster são usados para agrupar e gerenciar clusters.
  • Os Clusters são usados para computações de código aberto e são hospedados em um pool de clusters.

Pools de Clusters

O HDInsight no AKS é executado no Serviço de Kubernetes do Azure (AKS). O recurso de nível superior é o Pool de Clusters e gerencia todos os clusters em execução no mesmo cluster do AKS. Quando você cria um pool de clusters, um cluster do AKS subjacente é criado ao mesmo tempo para hospedar todos os clusters no pool. Os pools de clusters são um agrupamento lógico de clusters, que ajuda a criar uma interoperabilidade robusta entre vários tipos de cluster e permite que as empresas tenham os clusters na mesma rede virtual. Os pools de clusters fornecem acesso rápido e econômico a todos os tipos de clusters criados sob demanda e em escala. Um pool de clusters corresponde a um cluster na infraestrutura do AKS.

Clusters

Os Clusters são cargas de trabalho de computação individuais de código aberto, como o Apache Spark, Apache Flink e Trino, que podem ser criadas rapidamente em poucos minutos com configurações predefinidas e poucos cliques. Embora seja executado no mesmo pool de clusters, cada cluster pode ter suas próprias configurações, como tipo de cluster, versão, tamanho da VM do nó e contagem de nós. Os clusters estão em execução em recursos de computação separados com seu próprio DNS e pontos de extremidade.

Recursos atualmente em versão prévia

A lista de tabelas a seguir mostra os recursos do HDInsight no AKS que estão atualmente em versão prévia. As versões prévias dos recursos estão classificadas em ordem alfabética.

Área Recursos
Conceitos básicos Criar Pool e clusters usando portal, suporte Web secure shell (ssh), capacidade de escolher o número de nós de trabalho durante a criação do cluster
Armazenamento Suporte de Armazenamento do ADLS Gen2
Metastore Suporte a Metastore externo para Trino, Spark e Flink, integração com o HDInsight
Segurança Suporte para ARM RBAC, Suporte para autenticação baseada em MSI, Opção para fornecer acesso de cluster a outros usuários
Registro em log e monitoramento Agregação de log na análise de log do Azure, para logs de servidor, métricas de Cluster e Serviço por meio do Prometheus e Grafana Gerenciados, métricas de Servidor de suporte do Azure Monitor, página de Status do Serviço para monitorar a Integridade do serviço
Dimensionamento automático Dimensionamento Automático baseado em carga e Dimensionamento Automático baseado em Agendamento
Personalizar e Configurar Clusters Suporte para ações de script durante a criação de cluster, Suporte para gerenciamento de biblioteca, Definições de Configuração de serviço após a criação do cluster
Trino Suporte para o catálogos do Trino, Suporte para a CLI do Trino, suporte do DBeaver para envio de consultas, adição ou remoção de plugins e conectores, Suporte para consultas de registro de eventos, Suporte para estatísticas de consulta de verificação para o Conector no painel do Trino, Suporte para o painel do Trino para monitorar consultas, Armazenamento em cache de consultas, Integração com o Power BI, Integração com o Apache Superset, Redash, suporte para vários conectores
Flink Suporte para interface do usuário da Web nativa do Flink, suporte do Flink com o HMS para DStream, envio de trabalhos para o cluster usando a API REST e o portal do Azure, Execução de programas empacotados como arquivos JAR por meio da CLI do Flink, suporte para pontos de salvamento persistentes, suporte para atualização das opções de configuração enquanto o trabalho está em execução, conexão com vários serviços do Azure: Azure Cosmos DB, Azure Databricks, Azure Data Explorer, Hubs de Eventos do Azure, Hub IoT do Azure, Azure Pipelines, Gerenciador de Orquestração de Fluxo de Trabalho do Azure Data Factory,, HDInsight do Kafka, envio de trabalhos para o cluster usando a CLI do Flink e CDC com o Flink
Spark Jupyter Notebook, suporte para o Delta lake 2.0, suporte do Zeppelin, suporte do ATS, suporte para interface de servidor de Histórico do Yarn, envio de trabalho usando o SSH, envio de trabalho usando o SDK e Notebook do Machine Learning

Roteiro de recursos

Recurso Linha do tempo de versão estimada Status
Escala Automática - Baseado em Carga - Trino Q1 2024 Concluído
Embaralhar o dimensionamento automático baseado em carga com reconhecimento para o Spark Q2 2024 Em Andamento
Atualização no Local Q2 2024 Concluído(a)
Suporte à instância reservada Q2 2024 Em Andamento
Autenticação baseada em MSI para o Metastore (SQL) Q1 2024 Em Andamento
Spark 3.4 Q2 2024 Em Andamento
Trino 426 Q1 2024 Concluído
Ranger para o RBAC Q2 2024 Em Andamento
Suporte ao modo aplicativo para Flink Q1 2024 Concluído(a)
Flink 1.17 Q1 2024 Concluído
Suporte ao ACID do Spark Q1 2024 Em Andamento
SKUs configuráveis para o Headnode, SSH Q2 2024 Em Andamento
Suporte ao Gateway do SQL do Flink Q1 2024 Concluído
Clusters privados para o HDInsight no AKS Q1 2024 Concluído(a)
Suporte do Ranger para o Spark SQL T4 2024 Em Andamento
ACLs do Ranger na camada de armazenamento T4 2024 Em Andamento
Suporte para o One Lake como contêiner primário Q2 2024 Em Andamento