Что такое представление?
Представление является результатом запроса по одной или нескольким таблицам и представлениям в каталоге Unity. Представление — это объект только для чтения, состоящий из одной или нескольких таблиц и представлений в хранилище метаданных. Вы можете создать из таблиц и из других представлений в нескольких схемах и каталогах.
В этой статье описываются представления, которые можно создать в Azure Databricks.
Представления в каталоге Unity
В каталоге Unity представления располагаются на третьем уровне трехуровневого пространства имен (catalog.schema.view
):
Представление хранит текст запроса обычно в одном или нескольких источниках данных или таблицах в хранилище метаданных. В Azure Databricks представление эквивалентно кадру данных Spark, сохраненном как объект в схеме. В отличие от кадров данных, можно запрашивать представления из любого места в Azure Databricks, предполагая, что у вас есть разрешение на это. Создание представления не обрабатывает и не записывает данные. Только текст запроса регистрируется в хранилище метаданных в связанной схеме.
Примечание.
Представления могут иметь другую семантику выполнения, если они поддерживаются источниками данных, отличными от разностных таблиц. Databricks рекомендует всегда определять представления, ссылаясь на источники данных с помощью имени таблицы или представления. Определение представлений для наборов данных путем указания пути или URI может привести к путанице требований к управлению данными.
Материализованные представления
Материализованные представления постепенно вычисляют и обновляют результаты, возвращаемые определяющим запросом.
Вы можете зарегистрировать материализованные представления в каталоге Unity с помощью Databricks SQL или определить их как часть конвейера Delta Live Tables. См. статью "Использование материализованных представлений в Databricks SQL " и "Что такое разностные динамические таблицы?".
Временные представления
Временное представление имеет ограниченную область и сохраняемость и не регистрируется в схеме или каталоге. Время существования временного представления зависит от используемой среды.
- В записных книжках и заданиях область действия временных представлений ограничена уровнем записной книжки или скрипта. Они не могут ссылаться за пределами записной книжки, в которой они объявлены, и больше не существуют, когда записная книжка отсоединяется от кластера.
- В Databricks SQL область действия временных представлений ограничена уровнем запроса. Несколько инструкций в одном запросе могут использовать временное представление, однако на него нельзя ссылаться в других запросах даже в рамках одной панели мониторинга.
Динамические представления
Динамические представления можно использовать для обеспечения управления доступом на уровне строк и столбцов в дополнение к маскированию данных. См. раздел Создание динамического представления.
Представления в хранилище метаданных Hive (устаревшая версия)
Вы можете определить устаревшие представления Hive для любого источника данных и зарегистрировать их в устаревшем хранилище метаданных Hive. Databricks рекомендует перенести все устаревшие представления Hive в каталог Unity. Просмотр представлений в хранилище метаданных Hive.
Глобальное временное представление Hive (устаревшая версия)
Глобальные временные представления — это устаревшая функция Azure Databricks, которая позволяет зарегистрировать временное представление, доступное для всех рабочих нагрузок, работающих с вычислительным ресурсом. Глобальные временные представления — это устаревшая удержание Hive и HDFS. Databricks рекомендует использовать глобальные временные представления.