Março de 2018
As versões são disponibilizadas em fases. Talvez sua conta do Azure Databricks só seja atualizada uma semana após a data de lançamento inicial.
Detalhes de execução de comando
27 de março a 3 de abril de 2018: Versão 2.68
Ao executar um comando em um notebook, agora você verá informações detalhadas sobre o andamento.
Suporte para CLI do Databricks
27 de março a 3 de abril de 2018: Versão 2.68
CLI 0.6.1 do Databricks oferece suporte a --profile
em todas as posições.
Confira CLI do Databricks (herdada).
ACLs habilitadas por padrão para novos clientes do SKU Premium
27 de março a 3 de abril de 2018: Versão 2.68
ACLs (Listas de controle de acesso) agora são habilitadas por padrão para todos os novos clientes na SKU Premium. Os atuais clientes devem continuar habilitando as ACLs manualmente.
Confira As listas de controles de acesso não podem mais ser desabilitadas.
O Azure Databricks já está disponível ao público em geral
22 de março de 2018
Temos o prazer de anunciar que o Azure Databricks agora está disponível para o público geral. Nas últimas semanas, adicionamos funcionalidade para ajudar a tornar a experiência de Azure Databricks ainda melhor, inclusive:
- Emparelhamento de VNet (rede virtual), que permite usar o Apache Kafka no HDInsight com o Azure Databricks
- O Microsoft Power BI agora inclui um conector interno do Spark
- Conector do Azure Synapse Analytics
- Conector de Hubs de Eventos do Azure (e Hub IoT)
- Suporte ao Azure Data Factory v2 (versão prévia)
- Gerenciamento de segredos (versão prévia)
- Mais regiões do Azure
- Melhorias de desempenho e documentação
E, é claro, o Azure Databricks continua a fornecer integrações fáceis com o Armazenamento de Blobs do Azure, Azure Data Lake Store e Azure Cosmos DB.
Complementando a documentação fornecida neste site, o video2.skills-academy.com fornece material introdutório, informações sobre o gerenciamento de contas do Azure e tutoriais de ponta a ponta.
Novo tema do site do documento
21 de março de 2018
Atualizamos a aparência e o comportamento do nosso site de documentação. Esperamos que você goste!
Dimensionamento automático do armazenamento local
13 a 20 de março de 2018: Versão 2.67
Todos os clusters no Azure Databricks são iniciados com o dimensionamento automático do armazenamento local habilitado. Isso significa que o Azure Databricks anexa automaticamente discos gerenciados adicionais às VMs de trabalho do cluster sempre que elas ficam com pouco espaço em disco.
Consulte Habilitar o dimensionamento automático do armazenamento local para obter mais informações.
Emparelhamento de rede virtual (VNet)
13 a 20 de março de 2018: Versão 2.67
Adição de suporte a emparelhamento de VNet (rede virtual) para permitir que a rede virtual na qual seu recurso de Azure Databricks está sendo executado seja emparelhada com outra rede virtual do Azure.
Confira Emparelhar redes virtuais para obter mais informações.
Log de eventos do cluster
13 a 20 de março de 2018: Versão 2.67
A página detalhes do cluster tem uma nova guia Log de Eventos que exibe eventos importantes do ciclo de vida do cluster. Os eventos históricos podem ser exibidos por 60 dias, o que é comparável a outros tempos de retenção de dados no Azure Databricks.
Consulte logs de eventos de computação para obter mais informações.
CLI do Databricks: versão 0.6.0
13 de março de 2018: databricks-cli 0.6.0
A CLI do Databricks agora oferece suporte ao Python 3.
Confira CLI do Databricks (herdada) para obter mais informações.
Gerenciamento de execução de trabalho
13 a 20 de março de 2018: Versão 2.67
Agora você pode excluir uma execução de trabalho na página de detalhes do trabalho e na página de execução do trabalho.
O ponto de extremidade de Obtenção de Saída da execução do trabalho é GA, e a saída máxima retornada foi aumentada para 5 MB.
Editar permissões de cluster agora requer o modo de edição
13 a 20 de março de 2018: Versão 2.67
Anteriormente, era possível editar permissões de um cluster sem clicar em Editar, o que era inconsistente com outros atributos de cluster.
Um efeito colateral dessa alteração é que você não poderá mais editar permissões de um cluster pendente.
Exportação de modelo do Databricks ML
1º de março de 2018
Agora, a documentação aborda como usar o Exportação de Modelo do Databricks ML, que permite exportar modelos e pipelines de ML completos do Apache Spark. Esses modelos e pipelines exportados podem ser importados para outras plataformas (Spark e não Spark) para fazer a pontuação e fazer previsões. A Exportação de Modelo destina-se a aplicativos de baixa latência e com ML leve.
Observação
Esse recurso requer Databricks Runtime 4.0 ou superior.
Confira Exportação do modelo MLeap ML para obter mais informações.