Wprowadzenie: wykonywanie zapytań i wizualizowanie danych z notesu

Ten artykuł wprowadzający przeprowadzi Cię przez proces używania notesu usługi Azure Databricks do wykonywania zapytań dotyczących przykładowych danych przechowywanych w wykazie aparatu Unity przy użyciu języków SQL, Python, Scala i R, a następnie wizualizowania wyników zapytania w notesie.

Wymagania

Aby wykonać zadania opisane w tym artykule, musisz spełnić następujące wymagania:

  • Obszar roboczy musi mieć włączony katalog aparatu Unity. Aby uzyskać informacje na temat rozpoczynania pracy z wykazem aparatu Unity, zobacz Konfigurowanie wykazu aparatu Unity i zarządzanie nim.
  • Musisz mieć uprawnienia do używania istniejącego zasobu obliczeniowego lub utworzenia nowego zasobu obliczeniowego. Zobacz Wprowadzenie: Konfiguracja konta i obszaru roboczego lub zobacz administratora usługi Databricks.

Krok 1. Tworzenie nowego notesu

Aby utworzyć notes w obszarze roboczym, kliknij pozycję Nowa ikona Nowy na pasku bocznym, a następnie kliknij przycisk Notes. W obszarze roboczym zostanie otwarty pusty notes.

Aby dowiedzieć się więcej na temat tworzenia notesów i zarządzania nimi, zobacz Zarządzanie notesami.

Krok 2. Wykonywanie zapytań względem tabeli

Wykonaj zapytanie dotyczące samples.nyctaxi.trips tabeli w katalogu aparatu Unity przy użyciu wybranego języka.

  1. Skopiuj i wklej następujący kod do nowej pustej komórki notesu. Ten kod wyświetla wyniki z wykonywania samples.nyctaxi.trips zapytań dotyczących tabeli w wykazie aparatu Unity.

    SQL

    SELECT * FROM samples.nyctaxi.trips
    

    Python

    display(spark.read.table("samples.nyctaxi.trips"))
    

    Scala

    display(spark.read.table("samples.nyctaxi.trips"))
    

    R

    library(SparkR)
    display(sql("SELECT * FROM samples.nyctaxi.trips"))
    
  2. Naciśnij , Shift+Enter aby uruchomić komórkę, a następnie przejdź do następnej komórki.

    Wyniki zapytania są wyświetlane w notesie.

Krok 3. Wyświetlanie danych

Wyświetl średnią kwotę taryfy według odległości podróży pogrupowane według kodu pocztowego odbioru.

  1. Obok karty Tabela kliknij+, a następnie kliknij pozycję Wizualizacja.

    Zostanie wyświetlony edytor wizualizacji.

  2. Na liście rozwijanej Typ wizualizacji sprawdź, czy wybrano pasek .

  3. Wybierz fare_amount kolumnę X.

  4. Wybierz trip_distance kolumnę Y.

  5. Wybierz Average jako typ agregacji.

  6. Wybierz pickup_zip jako kolumnę Grupuj według .

    Wykres słupkowy

  7. Kliknij przycisk Zapisz.

Następne kroki