Schnellstart: Erstellen Sie eine neue Lake-Datenbank mithilfe von Datenbankvorlagen

Dieser Schnellstart bietet Ihnen ein vollständiges Beispielszenario darüber, wie Sie Datenbankvorlagen anwenden können, um eine Lake-Datenbank zu erstellen, Daten an Ihrem neuen Modell auszurichten und die integrierte Erfahrung zum Analysieren der Daten zu verwenden.

Voraussetzungen

  • Mindestens Synapse-Benutzerrollenberechtigungen sind erforderlich, um eine Lake-Datenbankvorlage aus der Galerie zu erkunden.
  • Zum Erstellen einer Lake-Datenbank sind im Azure Synapse-Arbeitsbereich die Berechtigungen Synapse-Administrator oder Synapse-Mitwirkender erforderlich.
  • Die Berechtigungen Mitwirkender für Speicherblobdaten sind für Data Lake erforderlich, wenn die Option Tabelle aus Data Lake erstellen verwendet wird.

Eine Lake-Datenbank aus den Datenbank-Vorlagen erstellen

Verwenden Sie die Funktion neue Datenbank-Vorlagen, um eine Lake-Datenbank zu erstellen, die Sie verwenden können, um Ihr Datenobjekt für die neue Datenbank zu konfigurieren.

Für unser Szenario verwenden wir die Retail Datenbankvorlage und wählen die folgenden Entitäten aus:

  • Einzelhandelsprodukt - Ein Produkt ist alles, was auf dem Markt angeboten werden kann, das einen Bedarf durch mögliche Kunden decken kann. Dieses Produkt ist die Summe aller physischer, psychologischer, symbolischer und dienstleistungsorientierter Eigenschaften, die damit verbunden sind.
  • Transaktion - Die unterste Stufe von ausführbarer Arbeit oder Kundenaktivität. Eine Transaktion besteht aus einem oder mehreren diskreten Ereignissen.
  • TransaktionEinzelposten - Die Komponenten einer Transaktion aufgeschlüsselt nach Produkt und Menge, eines pro Einzelposten.
  • Partei - Eine Partei ist ein Individuum, eine Organisation, eine juristische Person, eine soziale Organisation oder ein Geschäftsbereich, der von Interesse für das Geschäft ist.
  • Kunde - Ein Kunde ist ein Individuum oder eine juristische Person, das oder die ein Produkt hat oder eine Dienstleistung in Anspruch nimmt oder erworben hat.
  • Kanal - Ein Kanal ist ein Weg, durch den Produkte oder Dienstleistungen verkauft und / oder vertrieben werden.

Am einfachsten finden Sie Entitäten, indem Sie das Suchfeld über den verschiedenen Geschäftsbereichen verwenden, die die Tabellen enthalten.

Screenshot eines Beispiels einer Datenbankvorlage für den Einzelhandel, die verwendet wird.

Lake-Datenbank konfigurieren

Nachdem Sie die Datenbank erstellt haben, stellen Sie sicher, dass das Speicherkonto und der Dateipfad auf einen Speicherort festgelegt sind, an dem Sie die Daten speichern möchten. Der Pfad ist standardmäßig das primäre Speicherkonto in Azure Synapse Analytics, kann aber an Ihre Anforderungen angepasst werden.

Screenshot der Eigenschaften einer einzelnen Entität in der Einzelhandelsdatenbankvorlage.

Veröffentlichen Sie alle Änderungen, um Ihr Layout zu speichern und in Azure Synapse Analytics verfügbar zu machen. Dieser Schritt schließt die Einrichtung der Lake-Datenbank ab und stellt sie allen Komponenten innerhalb und außerhalb von Azure Synapse Analytics zur Verfügung.

Daten in die Lake-Datenbank aufnehmen

Um Daten in die Lake-Datenbank aufzunehmen, können Sie Pipelines mit unverschlüsselten Datenflusszuordnungen (Data Flow Mappings) errichten, die über einen Workspace DB Connector verfügen, um die Daten direkt in das Datenbank-Verzeichnis zu laden. Sie können auch die interaktiven Spark-Notebooks verwenden, um Daten in die Lake-Datenbank-Verzeichnisse aufzunehmen:

%%sql
INSERT INTO `retail_mil`.`customer` VALUES (1,date('2021-02-18'),1022,557,101,'Tailspin Toys (Head Office)','Waldemar Fisar',90410,466);

Abfragen der Daten

Nachdem die Lake-Datenbank erstellt wurde, gibt es verschiedene Möglichkeiten, um die Daten abzufragen. Derzeit werden SQL-Datenbanken in serverlosen SQL-Pools unterstützt und verstehen automatisch das neu erstellte Lake-Datenbankformat.

SELECT TOP (100) [ProductId]
,[ProductName]
,[ProductDescription]
,[ProductInternalName]
,[ItemSku]
,[PrimaryBrandId]
FROM [Retail_mil].[dbo].[RetailProduct]

Die andere Möglichkeit, auf die Daten in Azure Synapse zuzugreifen, besteht darin, ein neues Spark-Notebook zu öffnen und die integrierte Erfahrung dort zu nutzen:

df = spark.sql("SELECT * FROM `Retail_mil`.`RetailProduct`")
df.show(10)

Trainieren von Machine Learning-Modellen

Sie können die Lake-Datenbank nutzen, um Konzepte von maschinellem Lernen zu trainieren und die Daten auszuwerten. Für mehr Einzelheiten siehe Konzepte von maschinellem Lernen trainieren

Nächste Schritte

Erfahren Sie mehr über die Möglichkeiten des Database Designers, indem Sie den Link unten verwenden.