Visualisieren von Abfragen und Erstellen eines Legacy-Dashboards

In diesem Tutorial wird das New York City Taxi-Dataset aus den Beispielen verwendet. Es wird gezeigt, wie Sie den SQL-Editor in Databricks SQL verwenden, um eine Visualisierung für verschiedene Abfragen zu und dann ein Dashboard mit diesen Visualisierungen zu erstellen. Außerdem wird gezeigt, wie Sie einen Dashboardparameter für jede Visualisierung auf dem Dashboard erstellen.

Wichtig

  • Databricks empfiehlt die Verwendung von KI/BI-Dashboards (ehemals Lakeview-Dashboards). Frühere Versionen von Dashboards, die zuvor als Databricks-SQL-Dashboards bezeichnet werden, werden jetzt als Legacy-Dashboards bezeichnet. Databricks rät davon ab, neue Legacy-Dashboards zu erstellen.
  • Konvertieren Sie Legacy-Dashboards mithilfe des Migrationstools oder der REST-API. Anweisungen zur Verwendung des integrierten Migrationstools finden Sie unter Klonen eines Legacy-Dashboards in einem KI/BI-Dashboard. Tutorials zum Erstellen und Verwalten von Dashboards mithilfe der REST-API finden Sie unter Dashboard-Tutorials.

Herstellen einer Verbindung mit Databricks SQL mit dem SQL-Editor

  1. Klicken Sie auf der Randleiste auf Neues Symbol Neu, und wählen Sie Abfrage aus.

    Der SQL-Editor wird geöffnet.

  2. Wählen Sie ein Warehouse aus.

    Beim erstmaligen Erstellen einer Abfrage wird die Liste der verfügbaren SQL-Warehouses in alphabetischer Reihenfolge angezeigt. Wenn Sie das nächste Mal eine Abfrage erstellen, ist das zuletzt verwendete Warehouse ausgewählt.

  3. Klicken Sie auf Serverloses Start-Warehouse. Dieses Warehouse wird automatisch für Sie erstellt, damit Sie schnell loslegen können. Wenn „Serverlos“ für Ihren Arbeitsbereich nicht aktiviert ist, wählen Sie Start-Warehouse aus. Informationen zum Erstellen von SQL-Warehouses finden Sie unter Erstellen eines SQL-Warehouse.

Abfragen der Verteilung der Abholzeit

  1. Fügen Sie im SQL-Editor die folgende Abfrage in das neue Abfragefenster ein, um die Verteilung der Taxiabholungen nach Stunde zurückzugeben.

    SELECT
    date_format(tpep_pickup_datetime, "HH") AS `Pickup Hour`,
    count(*) AS `Number of Rides`
    FROM
    samples.nyctaxi.trips
    GROUP BY 1
    
  2. Drücken Sie STRG/BEFEHL+EINGABE, oder klicken Sie auf Ausführen (1.000). Nach einigen Sekunden werden unter der Abfrage im Ergebnisbereich die Abfrageergebnisse angezeigt.

    Limit 1.000 ist standardmäßig für alle Abfragen ausgewählt, damit sichergestellt ist, dass die Abfrage maximal 1.000 Zeilen zurückgibt. Wenn eine Abfrage mit der Einstellung Limit 1000 gespeichert wird, gilt diese Einstellung für alle Ausführungen der Abfrage (auch innerhalb von Dashboards). Wenn für diese Abfrage alle Zeilen zurückgegeben werden sollen, können Sie die Auswahl von Limit 1.000 aufheben, indem Sie auf die Dropdownliste Ausführen (1.000) klicken. Wenn Sie einen anderen Grenzwert für die Anzahl von Zeilen angeben möchten, können Sie Ihrer Abfrage eine LIMIT-Klausel mit einem Wert Ihrer Wahl hinzufügen.

    Das Abfrageergebnis wird auf der Registerkarte „Ergebnisse“ angezeigt.

  3. Klicken Sie auf Speichern, und speichern Sie die Abfrage unter Pickup hour.

    Ergebnisse Ihrer ersten Abfrage (NYC Taxi-Abfrage)

Erstellen Sie eine Visualisierung für die Verteilung von Taxiabholungen nach Stunde.

  1. Klicken Sie neben der Registerkarte „Ergebnisse“ auf + und dann auf Visualisierung.

    Der Visualisierungs-Editor wird angezeigt.

  2. Vergewissern Sie sich, dass in der Dropdownliste VisualisierungstypLeiste ausgewählt ist.

  3. Ändern Sie den Visualisierungsnamen in Bar chart.

  4. Vergewissern Sie sich, dass Pickup Hour für die Dropdownliste Y-Spalte angegeben ist.

  5. Vergewissern Sie sich, dass Number of Rides und Sum für die Dropdownliste X-Spalte angegeben ist.

    Verteilung der Abholzeit

  6. Klicken Sie auf Speichern.

    Das gespeicherte Diagramm wird im SQL angezeigt.

  1. Klicken Sie im SQL-Editor auf +, und klicken Sie dann auf Neue Abfrage erstellen.

  2. Fügen Sie im neuen Abfragefenster die folgende Abfrage ein, um die Tagespreistrends zurückzugeben.

     SELECT
      T.weekday,
      CASE
        WHEN T.weekday = 1 THEN 'Sunday'
        WHEN T.weekday = 2 THEN 'Monday'
        WHEN T.weekday = 3 THEN 'Tuesday'
        WHEN T.weekday = 4 THEN 'Wednesday'
        WHEN T.weekday = 5 THEN 'Thursday'
        WHEN T.weekday = 6 THEN 'Friday'
        WHEN T.weekday = 7 THEN 'Saturday'
        ELSE 'N/A'
      END AS day_of_week,
      T.fare_amount,
      T.trip_distance
    FROM
      (
        SELECT
          dayofweek(tpep_pickup_datetime) as weekday,
          *
        FROM
          `samples`.`nyctaxi`.`trips`
      ) T
    
  3. Klicken Sie auf Speichern, und speichern Sie die Abfrage unter Daily fare to distance analysis.

  1. Klicken Sie neben der Registerkarte Ergebnisse auf + und dann auf Visualisierung.

    Der Visualisierungs-Editor wird angezeigt.

  2. Wählen Sie im Dropdownmenü Visualisierungstyp die Option Punkte aus.

  3. Ändern Sie den Visualisierungsnamen in Fare by distance.

  4. Legen Sie auf der Registerkarte Allgemein den Wert für die X-Spalte auf trip_distance und den Wert für die Y-Spalten auf fare_amount fest.

  5. Legen Sie in der Dropdownliste Gruppieren nach den Wert auf day_of_week fest.

  6. Legen Sie auf der Registerkarte X-Achse den Wert Name auf Trip distance (miles) fest.

  7. Legen Sie auf der Registerkarte Y-Achse den Wert Name auf Fare Amount (USD) fest.

  8. Klicken Sie unten auf der Seite auf Speichern.

    Das gespeicherte Diagramm wird im SQL angezeigt.

    Tagespreistrend

Erstellen eines Dashboards mithilfe dieser Visualisierungen

  1. Klicken Sie auf der Seitenleiste auf Symbol „New” Neu, und wählen Sie Legacy-Dashboard aus.

  2. Legen Sie den Dashboardnamen auf NYC taxi trip analysis fest.

  3. Klicken Sie auf Speichern.

  4. Wählen Sie in der Dropdownliste Warehouse auswählen die Option Serverloses Start-Warehouse aus. Wenn „Serverlos“ für Ihren Arbeitsbereich nicht aktiviert ist, wählen Sie Start-Warehouse aus.

  5. Klicken Sie in der Dropdownliste Hinzufügen auf Visualisierung.

  6. Wählen Sie im Fenster Widget „Visualisierung hinzufügen“ die Abfrage Entfernungsbasierte Analyse des Tagesfahrpreises aus.

  7. Wählen Sie in der Liste Vorhandene Visualisierung auswählen die Option Preis nach Entfernung aus.

  8. Geben Sie Daily fare trends in das Textfeld Titel ein.

    Widget „Visualisierung hinzufügen“

  9. Klicken Sie auf Zu Legacy-Dashboard hinzufügen.

    Die Visualisierung für Tagespreistrends wird auf der Dashboardentwurfsoberfläche angezeigt.

  10. Verwenden Sie die Dropdownliste Hinzufügen, um dem Dashboard ein zweites Widget hinzuzufügen, und klicken Sie dann auf Visualisierung.

  11. Wählen Sie im Fenster Widget „Visualisierung hinzufügen“ die Abfrage Abholzeit aus.

  12. Wählen Sie in der Liste Vorhandene Visualisierung auswählen die Option Balkendiagramm aus.

  13. Geben Sie Pickup hour distribution in das Textfeld Titel ein.

  14. Klicken Sie auf Zu Legacy-Dashboard hinzufügen.

  15. Passen Sie die Größe dieser Visualisierung an die Breite der ersten Visualisierung auf dem Dashboard an.

  16. Klicken Sie auf Bearbeitung abgeschlossen.

Anfängliches Dashboard

Hinzufügen eines Parameters für die Postleitzahl des Abholorts zu jeder Abfrage

  1. Öffnen Sie im SQL-Editor die Abfrage Entfernungsbasierte Analyse des Tagesfahrpreises.

  2. Fügen Sie die folgende WHERE-Klausel zur Abfrage Entfernungsbasierte Analyse des Tagesfahrpreises hinzu, um die Abfrage nach der Postleitzahl des Abholorts zu filtern.

    WHERE
      pickup_zip IN ({{ pickupzip }})
    
  3. Geben Sie im Textfeld pickupzip10018 ein, und klicken Sie dann auf Änderungen anwenden, um die Abfrage mit dem Parameter für die Postleitzahl des Abholorts auszuführen.

  4. Klicken Sie auf Speichern.

  5. Öffnen Sie die Abfrage Abholzeit.

  6. Fügen Sie der Abfrage WHEREAbholzeit die folgende -Klausel hinzu, um die Abfrage nach der Postleitzahl des Abholorts zu filtern. Fügen Sie diese Klausel vor der GROUP BY-Klausel hinzu.

       WHERE
         pickup_zip IN ({{ pickupzip }})
    
  7. Geben Sie im Textfeld pickupzip10018 ein, und klicken Sie dann auf Änderungen anwenden, um die Abfrage mit dem Filter für die Postleitzahl des Abholorts auszuführen.

  8. Klicken Sie auf Speichern.

Aktualisieren des Dashboards, um einen Dashboardparameter zu verwenden

  1. Öffnen Sie das Dashboard NYC Taxi-Fahrtanalyse.

    Jede der Visualisierungen enthält jetzt einen Parameter für die Postleitzahl des Abholorts.

    Widget: Parameter

  2. Klicken Sie auf das Optionsmenü Kebab-Menü für dieses Dashboard und dann auf Bearbeiten.

  3. Klicken Sie auf das Optionsmenü Kebab-Menü für die Visualisierung Tagespreistrends und dann auf Widgeteinstellungen ändern.

  4. Klicken Sie im Abschnitt Parameter auf das Stiftsymbol Symbol „Bearbeiten“ für Widgetparameter im Feld Wert.

    Anzeigen der Widgetparameter

  5. Ändern Sie im Fenster Quelle und Wert bearbeiten den Wert für Quelle in Neuer Dashboardparameter.

    Ändern der Widgetparameter in neue Dashboardparameter

  6. Klicken Sie auf OK, und klicken Sie dann auf Speichern.

    Der Dashboardparameter pickupzip wird angezeigt. Der Widgetparameter für die Visualisierung Tagespreistrends wird nicht mehr angezeigt.

    1. Klicken Sie auf das Optionsmenü Kebab-Menü für die Visualisierung Verteilung der Abholzeit und dann auf Widgeteinstellungen ändern.
  7. Klicken Sie im Abschnitt Parameter auf das Stiftsymbol Symbol „Bearbeiten“ für Widgetparameter im Feld Wert.

  8. Ändern Sie im Fenster Quelle und Wert bearbeiten den Wert für Quelle in Vorhandener Dashboardparameter.

  9. Vergewissern Sie sich, dass pickupzip als Wert für Schlüssel ausgewählt ist.

  10. Klicken Sie auf OK, und klicken Sie dann auf Speichern.

    Der Widgetparameter für die Visualisierung Verteilung der Abholzeit wird nicht mehr angezeigt.

  11. Klicken Sie auf Bearbeitung abgeschlossen.

  12. Ändern Sie den Wert des Dashboardparameters pickupzip in 10017, und klicken Sie dann auf Änderungen übernehmen.

    Die Daten in den einzelnen Visualisierungen zeigen nun die Daten für Abholungen im Bereich mit der Postleitzahl 10017 an.

    Ändern der Widgetparameter in neue Dashboardparameter