Visualizzare le query e creare un dashboard legacy

Questa esercitazione usa il set di dati dei taxi di New York City in Esempi. Illustra come usare l'editor SQL in Databricks SQL per creare una visualizzazione per ognuna di diverse query e quindi creare un dashboard usando queste visualizzazioni. Viene inoltre illustrato come creare un parametro di dashboard per ognuna delle visualizzazioni nel dashboard.

Importante

  • Databricks consiglia di usare i dashboard di IA/BI (in precedenza dashboard Lakeview). Le versioni precedenti dei dashboard, definite in precedenza dashboard SQL di Databricks, sono ora denominate dashboard legacy. Databricks non consiglia di creare nuovi dashboard legacy.
  • Convertire i dashboard legacy usando lo strumento di migrazione o l'API REST. Per istruzioni sull'uso dello strumento di migrazione predefinito, vedere Clonare un dashboard legacy in un dashboard AI/BI. Vedere Esercitazioni sui dashboard per esercitazioni sulla creazione e la gestione di dashboard con l'API REST.

Connettersi a Databricks SQL con l'editor SQL

  1. Nella barra laterale fare clic su Nuova icona Nuovo e selezionare Query.

    Verrà aperto l'Editor SQL.

  2. Selezionare un’istanza di warehouse.

    La prima volta che si crea una query, l'elenco dei warehouse SQL disponibili viene visualizzato in ordine alfabetico. La volta successiva che si crea una query, viene selezionata l'ultima istanza di SQL warehouse usata.

  3. Fare clic su Serverless Starter Warehouse. Questo warehouse viene creato automaticamente per facilitare l'avvio rapido. Se la funzionalità serverless non è abilitata per l'area di lavoro, scegliere Starter Warehouse. Per informazioni sulla creazione di SQL warehouse, vedere Creare un'istanza di SQL Warehouse.

Query per la distribuzione dell'ora di prelievo

  1. Nell'editor SQL incollare la seguente query nella nuova finestra di query per restituire la distribuzione dei prelievi dei taxi per ora.

    SELECT
    date_format(tpep_pickup_datetime, "HH") AS `Pickup Hour`,
    count(*) AS `Number of Rides`
    FROM
    samples.nyctaxi.trips
    GROUP BY 1
    
  2. Premere CTRL/CMD + INVIO o fare clic su Esegui (1000). Dopo alcuni secondi, i risultati della query vengono visualizzati sotto la query nel riquadro dei risultati.

    Il limite di 1000 è selezionato per impostazione predefinita per tutte le query per garantire che la query restituisca al massimo 1000 righe. Se una query viene salvata con l'impostazione Limite 1000, questa impostazione si applica a tutte le esecuzioni di query (incluse quelle nei dashboard). Se per questa query si desidera ottenere tutte le righe, è possibile deselezionare LIMIT 1000 facendo clic sull'elenco a discesa Esegui (1000). Se si desidera specificare un limite diverso per il numero di righe, è possibile aggiungere una clausola LIMIT nella query con un valore di propria scelta.

    Il risultato della query viene visualizzato nella scheda Risultati.

  3. Fare clic su Salva per salvare la query come Pickup hour.

    Risultati della prima query nyc taxi

Creare una visualizzazione per la distribuzione dei prelievi in taxi per ora.

  1. Accanto alla scheda Risultati, fare clic su + e poi su Visualizzazione.

    Viene visualizzato l'editor di visualizzazione.

  2. Nell'elenco a discesa Tipo di visualizzazione verificare che sia selezionata l'opzione Barra.

  3. Modificare il nome della visualizzazione in Bar chart.

  4. Verificare che Pickup Hour sia specificato per l'elenco a discesa della colonna Y.

  5. Verificare che Number of Rides e Sum siano specificati per l'elenco a discesa della colonna X.

    Distribuzione dell'orario di prelievo

  6. Fare clic su Salva.

    Il grafico salvato viene visualizzato nell'editor SQL.

  1. Nell'editor SQL fare clic su + e poi su Crea nuova query.

  2. Nella nuova finestra di query incollare la seguente query per ottenere i dati sull’andamento giornaliero delle tariffe.

     SELECT
      T.weekday,
      CASE
        WHEN T.weekday = 1 THEN 'Sunday'
        WHEN T.weekday = 2 THEN 'Monday'
        WHEN T.weekday = 3 THEN 'Tuesday'
        WHEN T.weekday = 4 THEN 'Wednesday'
        WHEN T.weekday = 5 THEN 'Thursday'
        WHEN T.weekday = 6 THEN 'Friday'
        WHEN T.weekday = 7 THEN 'Saturday'
        ELSE 'N/A'
      END AS day_of_week,
      T.fare_amount,
      T.trip_distance
    FROM
      (
        SELECT
          dayofweek(tpep_pickup_datetime) as weekday,
          *
        FROM
          `samples`.`nyctaxi`.`trips`
      ) T
    
  3. Fare clic su Salva per salvare la query come Daily fare to distance analysis.

  1. Accanto alla scheda Risultati, fare clic su + e poi su Visualizzazione.

    Viene visualizzato l'editor di visualizzazione.

  2. Nell'elenco a discesa Tipo di visualizzazione, selezionare A dispersione.

  3. Modificare il nome della visualizzazione in Fare by distance.

  4. Nella scheda Generale impostare il valore per la colonna X su trip_distance X il valore per le colonne Y su fare_amount.

  5. Nell'elenco a discesa Raggruppa per impostare il valore su day_of_week.

  6. Nella scheda Asse X impostare il valore Nome su Trip distance (miles).

  7. Nella scheda Asse Y impostare il valore Nome su Fare Amount (USD).

  8. Cliccare su Salva

    Il grafico salvato viene visualizzato nell'editor SQL.

    Andamento giornaliero delle tariffe

Creare un dashboard usando queste visualizzazioni

  1. Fare clic su Nuova icona Nuovo nella barra laterale e selezionare Dashboard legacy.

  2. Impostare il nome del dashboard su NYC taxi trip analysis.

  3. Fare clic su Salva.

  4. Nell'elenco a discesa Scegli warehouse selezionare Serverless Starter Warehouse. Se la funzionalità serverless non è abilitata per l'area di lavoro, scegliere Starter Warehouse.

  5. Nell'elenco a discesa Aggiungi fare clic su Visualizzazione.

  6. Nella finestra Aggiungi widget di visualizzazione selezionare la query Analisi delle tariffe giornaliere in base alla distanza.

  7. Nell'elenco Seleziona visualizzazione esistente selezionare Analisi per distanza.

  8. Nella casella di testo Titolo immettere Daily fare trends.

    Aggiungere il widget di visualizzazione

  9. Fare clic su Aggiungi al dashboard legacy.

    La visualizzazione Andamento delle tariffe giornaliere viene visualizzata nell'area di progettazione tratteggiata.

  10. Nell'elenco a discesa Aggiungi per aggiungere un secondo widget al dashboard e poi fare clic su Visualizzazione.

  11. Nella finestra Aggiungi widget di visualizzazione selezionare la query Ora di prelievo.

  12. Nell'elenco Seleziona visualizzazione esistente selezionare Grafico a barre.

  13. Nella casella di testo Titolo immettere Pickup hour distribution.

  14. Fare clic su Aggiungi al dashboard legacy.

  15. Ridimensionare questa visualizzazione in modo che corrisponda alla larghezza della prima visualizzazione nel dashboard.

  16. Fare clic su Modifica completata.

Dashboard iniziale

Aggiungere un parametro di codice postale di ritiro a ogni query

  1. Nell'editor SQL aprire la query Analisi delle distanze giornaliere.

  2. Aggiungere la seguente clausola WHERE alla query Analisi delle distanze giornaliere per filtrare la query in base al codice postale di prelievo.

    WHERE
      pickup_zip IN ({{ pickupzip }})
    
  3. Nella casella di testo pickupzip immettere 10018 e poi fare clic su Applica modifiche per eseguire la query con il parametro del codice postale di prelievo.

  4. Fare clic su Salva.

  5. Aprire la query Ora di prelievo.

  6. Aggiungere la seguente clausola WHERE alla query Ora di prelievo per filtrare la query in base al codice postale di prelievo. Aggiungere questa clausola prima della clausola GROUP BY.

       WHERE
         pickup_zip IN ({{ pickupzip }})
    
  7. Nella casella di testo pickupzip immettere 10018 e poi fare clic su Applica modifiche per eseguire la query con il filtro del codice postale di prelievo.

  8. Fare clic su Salva.

Aggiornare il dashboard per usare un parametro del dashboard

  1. Aprire il dashboard di analisi delle corse dei taxi di New York.

    Ogni visualizzazione adesso comprende un parametro per il codice postale di prelievo.

    Widget - parametri

  2. Fare clic sul menu kebab Menu kebab per questo dashboard e poi su Modifica.

  3. Fare clic sul menu Menu kebab kebab per la visualizzazione Andamento tariffe giornaliere e poi su Modifica impostazioni widget.

  4. Nella sezione Parametri fare clic sull'icona Icona Modifica a forma di matita per il parametro Widget nel campo Valore.

    Visualizzare i parametri del widget

  5. Nella finestra Modifica origine e valore modificare il parametro Origine in Nuovo parametro dashboard.

    Modificare i parametri del widget nei nuovi parametri del dashboard

  6. Fare clic su OK e poi su Salva.

    Viene visualizzato il parametro del dashboard pickupzip e il parametro widget per la visualizzazione Andamento delle tariffe giornaliere non viene più visualizzato.

    1. Fare clic sul menu Menu kebab kebab per la visualizzazione Distribuzione orari di prelievo e poi su Modifica impostazioni widget.
  7. Nella sezione Parametri fare clic sull'icona Icona Modifica a forma di matita per il parametro Widget nel campo Valore.

  8. Nella finestra Modifica origine e valore modificare il parametro Origine in Parametro dashboard esistente.

  9. Verificare che pickupzip sia selezionato come valore chiave.

  10. Fare clic su OK e poi su Salva.

    Il parametro del widget per la visualizzazione Distribuzione orari di prelievo non viene più visualizzato.

  11. Fare clic su Modifica completata.

  12. Modificare il valore del parametro dashboard pickupzip in 10017 e poi fare clic su Applica modifiche.

    In ogni visualizzazione vengono ora visualizzati i dati relativi ai prelievi nel codice postale 10017.

    Modificare i parametri del widget nei nuovi parametri del dashboard