Visualizações em blocos de anotações Databricks
O Azure Databricks tem suporte interno para gráficos e visualizações no Databricks SQL e em blocos de anotações. Esta página descreve como trabalhar com visualizações em um bloco de anotações Databricks. Para obter informações sobre como usar visualizações no Databricks SQL, consulte Visualização no Databricks SQL.
Para exibir os tipos de visualizações, consulte Tipos de visualização.
Importante
Para obter informações sobre uma versão de visualização dos gráficos do Azure Databricks, consulte Visualizar visualizações de gráficos.
Criar uma nova visualização
Para recriar o exemplo nesta seção, use o seguinte código:
sparkDF = spark.read.csv("/databricks-datasets/bikeSharing/data-001/day.csv", header="true", inferSchema="true")
display(sparkDF)
Para criar uma visualização, clique acima + de um resultado e selecione Visualização. O editor de visualização é exibido.
Na lista suspensa Tipo de visualização, escolha um tipo.
Selecione os dados a serem exibidos na visualização. Os campos disponíveis dependem do tipo selecionado.
Clique em Guardar.
Ferramentas de visualização
Se você passar o mouse sobre o canto superior direito de um gráfico no editor de visualização, uma barra de ferramentas Plotly será exibida onde você poderá executar operações como selecionar, ampliar e deslocar.
Se você passar o mouse sobre o canto superior direito de um gráfico fora do editor de visualização, um subconjunto menor de ferramentas será exibido:
Criar um novo perfil de dados
Nota
Disponível em Databricks Runtime 9.1 LTS e superior.
Os perfis de dados exibem estatísticas resumidas de um Apache Spark DataFrame, um pandas DataFrame ou uma tabela SQL em formato tabular e gráfico. Para criar um perfil de dados a partir de uma célula de resultados, clique e + selecione Perfil de Dados.
O Azure Databricks calcula e exibe as estatísticas de resumo.
- As características numéricas e categóricas são mostradas em tabelas separadas.
- Na parte superior do separador, pode ordenar ou procurar funcionalidades.
- Na parte superior da coluna do gráfico, você pode optar por exibir um histograma (Padrão) ou quantis.
- Marque expandir para ampliar os gráficos.
- Verifique o log para exibir os gráficos em uma escala de log.
- Você pode passar o cursor sobre os gráficos para obter informações mais detalhadas, como os limites de uma coluna de histograma e o número de linhas nela ou o valor quantílico.
Você também pode gerar perfis de dados programaticamente; Consulte o comando summarize (dbutils.data.summarize).
Trabalhar com visualizações e perfis de dados
Nota
Os perfis de dados estão disponíveis no Databricks Runtime 9.1 LTS e superior.
Renomear, duplicar ou remover uma visualização ou perfil de dados
Para renomear, duplicar ou remover uma visualização ou um perfil de dados, clique na seta para baixo à direita do nome da guia.
Você também pode alterar o nome clicando diretamente nele e editando o nome no local.
Editar uma visualização
Clique abaixo da visualização para abrir o editor de visualização. Quando terminar de fazer alterações, clique em Salvar.
Editar cores
Você pode personalizar as cores de uma visualização ao criá-la ou editando-a.
- Crie ou edite uma visualização.
- Clique em Cores.
- Para modificar uma cor, clique no quadrado e selecione a nova cor seguindo um destes procedimentos:
- Clique nele no seletor de cores.
- Insira um valor hexadecimal.
- Clique em qualquer lugar fora do seletor de cores para fechá-lo e salvar as alterações.
Ocultar ou mostrar temporariamente uma série
Para ocultar uma série em uma visualização, clique na série na legenda. Para mostrar a série novamente, clique nela novamente na legenda.
Para mostrar apenas uma única série, clique duas vezes na série na legenda. Para mostrar outras séries, clique em cada uma delas.
Baixar uma visualização
Para baixar uma visualização em formato .png, clique no ícone da câmera na célula do bloco de anotações ou no editor de visualização.
Numa célula de resultados, o ícone da câmara aparece no canto superior direito quando move o cursor sobre a célula.
No editor de visualização, o ícone da câmera aparece quando você move o cursor sobre o gráfico. Consulte Ferramentas de visualização.
Adicionar uma visualização ou perfil de dados a um dashboard
- Clique na seta para baixo à direita do nome da guia.
- Selecione Adicionar ao painel. É apresentada uma lista de vistas de dashboard disponíveis, juntamente com uma opção de menu Adicionar ao novo dashboard.
- Selecione um painel ou selecione Adicionar ao novo painel. O painel é exibido, incluindo a visualização ou o perfil de dados recém-adicionado.