Прием данных в databricks lakehouse

Azure Databricks предлагает различные способы приема данных из различных источников в озеро, поддерживаемое Delta Lake. В этой статье перечислены источники данных и приведены ссылки на действия по приему данных из каждого типа источника.

Хранилище облачных объектов

Сведения о настройке добавочного приема из облачного хранилища объектов см. в статье "Прием данных из облачного хранилища объектов".

LakeFlow Connect

Databricks LakeFlow Connect предлагает собственные соединители для приема из корпоративных приложений и баз данных. Результирующий конвейер приема управляется каталогом Unity и управляется бессерверными вычислительными ресурсами и разностными динамическими таблицами.

LakeFlow Connect использует эффективные добавочные операции чтения и записи для ускорения приема данных, более масштабируемого и более экономичного, а данные остаются свежими для нижнего потребления.

Источники потоковой передачи

Azure Databricks может интегрироваться со службами потоковой передачи сообщений для приема данных почти в реальном времени в lakehouse. См . инструкции по потоковой передаче и добавочному приему.

Локальные файлы данных

Вы можете безопасно отправить локальные файлы данных или скачать файлы из общедоступного URL-адреса. См. статью "Отправка файлов в Azure Databricks".

Перенос данных в Delta Lake

Сведения о переносе существующих данных в Delta Lake см. в статье "Миграция данных в Delta Lake".