Explorar e criar tabelas no DBFS
Importante
Esta documentação foi desativada e pode não ser atualizada. Os produtos, serviços ou tecnologias mencionados neste conteúdo não são mais suportados. Consulte Carregar ficheiros para o Azure Databricks, Criar ou modificar uma tabela utilizando o carregamento de ficheiros e O que é o Explorador de Catálogos?.
Acesse a interface do usuário de upload de arquivos DBFS herdada e criação de tabelas por meio da interface do usuário add data. Clique em New > Data > DBFS.
Você também pode acessar a interface do usuário a partir de blocos de anotações clicando em Adicionar dados de arquivo>.
O Databricks recomenda o uso do Catalog Explorer para uma experiência aprimorada de exibição de objetos de dados e gerenciamento de ACLs e da página Criar ou modificar tabela a partir de upload de arquivos para ingerir facilmente arquivos pequenos no Delta Lake.
Nota
A disponibilidade de alguns elementos descritos neste artigo varia de acordo com as configurações do espaço de trabalho. Entre em contato com o administrador do espaço de trabalho ou com a equipe da conta do Azure Databricks.
Importar dados
Se você tiver pequenos arquivos de dados em sua máquina local que deseja analisar com o Azure Databricks, poderá importá-los para o DBFS usando a interface do usuário.
Nota
Os administradores do espaço de trabalho podem desativar esse recurso. Para obter mais informações, consulte Gerenciar o carregamento de dados.
Criar uma tabela
Você pode iniciar a interface do usuário da tabela de criação do DBFS clicando em Novo na barra lateral ou no botão DBFS na interface do usuário adicionar dados. Você pode preencher uma tabela a partir de arquivos no DBFS ou carregar arquivos.
Com a interface do usuário, você só pode criar tabelas externas.
Escolha uma fonte de dados e siga as etapas na seção correspondente para configurar a tabela.
Se um administrador de espaço de trabalho do Azure Databricks tiver desabilitado a opção Carregar arquivo, você não terá a opção de carregar arquivos, poderá criar tabelas usando uma das outras fontes de dados.
Instruções para carregar arquivo
- Arraste os arquivos para a zona suspensa Arquivos ou clique na zona de descarte para procurar e escolher arquivos. Após o upload, um caminho é exibido para cada arquivo. O caminho será algo como
/FileStore/tables/<filename>-<integer>.<file-type>
. Você pode usar esse caminho em um bloco de anotações para ler dados. - Clique em Criar tabela com interface do usuário.
- Na lista suspensa Cluster, escolha um cluster.
Instruções para DBFS
- Selecionar um ficheiro.
- Clique em Criar tabela com interface do usuário.
- Na lista suspensa Cluster, escolha um cluster.
- Arraste os arquivos para a zona suspensa Arquivos ou clique na zona de descarte para procurar e escolher arquivos. Após o upload, um caminho é exibido para cada arquivo. O caminho será algo como
Clique em Visualizar tabela para visualizá-la.
No campo Nome da tabela, opcionalmente, substitua o nome da tabela padrão. Um nome de tabela pode conter apenas caracteres alfanuméricos minúsculos e sublinhados e deve começar com uma letra minúscula ou sublinhado.
No campo Criar no banco de dados, opcionalmente, substitua o banco de dados selecionado
default
.No campo Tipo de arquivo, opcionalmente, substitua o tipo de arquivo inferido.
Se o tipo de ficheiro for CSV:
- No campo Delimitador de Coluna, selecione se deseja substituir o delimitador inferido.
- Indique se a primeira linha deve ser usada como título de coluna.
- Indique se o esquema deve ser inferido.
Se o tipo de ficheiro for JSON, indique se o ficheiro tem várias linhas.
Clique em Criar tabela.
Exibir bancos de dados e tabelas
Nota
Os espaços de trabalho com o Catalog Explorer ativado não têm acesso ao comportamento herdado descrito abaixo.
Clique em Catálogo na barra lateral. O Azure Databricks seleciona um cluster em execução ao qual você tem acesso. A pasta Bancos de dados exibe a lista de bancos de dados com o default
banco de dados selecionado. A pasta Tabelas exibe a lista de tabelas no default
banco de dados.
Você pode alterar o cluster no menu Bancos de dados, criar a interface do usuário da tabela ou exibir a interface do usuário da tabela. Por exemplo, no menu Bancos de dados:
Clique na seta para baixo na parte superior da pasta Bancos de dados.
Selecione um cluster.
Ver detalhes da tabela
A exibição de detalhes da tabela mostra o esquema da tabela e os dados de exemplo.
Clique em Catálogo na barra lateral.
Na pasta Bancos de dados, clique em um banco de dados.
Na pasta Tabelas, clique no nome da tabela.
Na lista suspensa Cluster, selecione opcionalmente outro cluster para renderizar a visualização da tabela.
Nota
Para exibir a visualização da tabela, uma consulta SQL do Spark é executada no cluster selecionado na lista suspensa Cluster . Se o cluster já tiver uma carga de trabalho em execução, a visualização da tabela pode levar mais tempo para carregar.
Excluir uma tabela usando a interface do usuário
- Clique em Catálogo na barra lateral.
- Clique ao lado do nome da tabela e selecione Excluir.