Erfassen von Daten in einem Databricks-Lakehouse

Azure Databricks bietet verschiedene Möglichkeiten, Daten aus verschiedenen Quellen in ein von Delta Lake unterstütztes Lakehouse zu importieren. In diesem Artikel werden Datenquellen aufgelistet und Links zu den Schritten für die Aufnahme von Daten aus den einzelnen Quellentypen bereitgestellt.

Cloudobjektspeicher

Weitere Informationen zur Konfiguration der inkrementellen Aufnahme von Daten aus dem Cloud-Objektspeicher finden Sie unter Aufnahme von Daten aus dem Cloud-Objektspeicher.

LakeFlow Connect

Databricks LakeFlow Connect bietet native Connectors zum Aufnehmen von Daten aus Unternehmensanwendungen und Datenbanken. Die resultierende Erfassungspipeline wird über Unity Catalog gesteuert und von serverlosem Computing sowie Delta Live Tables (DLT) unterstützt.

LakeFlow Connect nutzt effiziente inkrementelle Lese- und Schreibvorgänge, um die Erfassung von Daten schneller, skalierbarer und kosteneffizienter zu gestalten, während Ihre Daten für den nachgeschalteten Verbrauch frisch bleiben.

Streamingquellen

Azure Databricks kann in Stream-Messaging-Dienste integriert werden, um Daten nahezu in Echtzeit in ein Lakehouse zu erfassen. Siehe Streaming und inkrementelle Aufnahme.

Lokale Datendateien

Sie können lokale Datendateien sicher hochladen oder Dateien aus einer öffentlichen URL herunterladen. Siehe Hochladen von Dateien in Azure Databricks.

Migrieren von Daten in Delta Lake

Informationen zum Migrieren vorhandener Daten nach Delta Lake finden Sie unter Migrieren von Daten zum Delta Lake.