Cvičení: Zkoumání trendů pomocí dotazů

Dokončeno

Prozkoumali jste nezpracovaná data a rozsah neznámé meteorologické datové sady. V této lekci pomocí vizualizací zjistíte, jak se data distribuují.

Časový diagram

Vzpomeňte si, že některé datové sloupce, které jste viděli v poslední lekci, byly typu DateTime a představovaly počáteční a koncové časy událostí stormu. Pokud chcete zjistit, která kalendářní data obsahují události storm-data, můžete vykreslit počet položek v porovnání s časem.

Všimněte si, že předchozí jednotka používala podmnožinu 50 datových řádků, zatímco tato jednotka bude používat úplnou datovou sadu.

Následující dotaz vytvoří časový diagram počtu událostí storm za 8hodinový interval jako funkci času.

  1. Spusťte tento dotaz:

    Spuštění dotazu

    StormEvents
    | summarize Count = count() by bin (StartTime, 8h)
    | render timechart
    

    Měli byste získat výsledky, které vypadají jako na následujícím obrázku:

    Snímek obrazovky s výsledky časového grafu

  2. Podívejte se na výsledný graf. Vidíte nějaké zjevné mezery nebo anomálie?

Události podle stavu

Dalším způsobem, jak se podívat na distribuci dat, je seskupit podle umístění události (v tomto případě stav) a zjistit, jaký druh trendů je možné pochopit z distribuce.

  1. Spusťte tento dotaz:

    Spuštění dotazu

    StormEvents
    | summarize event = count() by State
    | sort by event
    | render barchart 
    

    Měli byste získat výsledky, které vypadají jako na následujícím obrázku:

    Snímek obrazovky pruhového grafu zobrazující poškození podle stavu

  2. Podívejte se na výsledný graf. V seznamu je 67 různých států, včetně těch, které nejsou oficiálními státy v USA, například "Americká Samoa" a "Havajská voda". Dává tento typ geografické distribuce bouře smysl?

  3. Podkladová data můžete zobrazit tak , že vyberete kartu Tabulka nad grafem. Pomáhají vám skutečná čísla lépe porozumět distribuci dat?

    Snímek obrazovky s tabulkou dat pro graf poškození

Události podle zeměpisné polohy

Viděli jste, jak se počet událostí liší podle času a stavu. Připomeňme si, že mapování schématu ukázalo, že každá položka události storm obsahuje latitudinální a podélné informace. Pojďme se podívat, jak se datové clustery na mapě.

  1. Následující dotaz seskupí události podle geografické buňky a spočítá počet událostí v každé buňce. Tyto výsledky se zobrazí na mapě, kde velikost kruhu odpovídá počtu událostí v buňce. Spusťte tento dotaz:

    Spuštění dotazu

    StormEvents
    | project BeginLon, BeginLat
    | where isnotnull(BeginLat) and isnotnull(BeginLon)
    | summarize count_summary=count() by hash = geo_point_to_s2cell(BeginLon, BeginLat,6)
    | project geo_s2cell_to_central_point(hash), count_summary
    | extend Events = "count"
    | render piechart with (kind = map)
    

    Měli byste získat výsledky, které vypadají jako na následujícím obrázku:

    Snímek obrazovky s výsledkem mapového grafu s kruhy zobrazující počet událostí v dané oblasti

  2. Zkuste přiblížit stisknutím kláves Ctrl+. Teď, když jste viděli typy bouří reprezentovaných, dává smysl, že v oblasti USA a mexického zálivu existuje více těchto typů bouří?