Cvičení: Zkoumání trendů pomocí dotazů
Prozkoumali jste nezpracovaná data a rozsah neznámé meteorologické datové sady. V této lekci pomocí vizualizací zjistíte, jak se data distribuují.
Časový diagram
Vzpomeňte si, že některé datové sloupce, které jste viděli v poslední lekci, byly typu DateTime a představovaly počáteční a koncové časy událostí stormu. Pokud chcete zjistit, která kalendářní data obsahují události storm-data, můžete vykreslit počet položek v porovnání s časem.
Všimněte si, že předchozí jednotka používala podmnožinu 50 datových řádků, zatímco tato jednotka bude používat úplnou datovou sadu.
Následující dotaz vytvoří časový diagram počtu událostí storm za 8hodinový interval jako funkci času.
Spusťte tento dotaz:
StormEvents | summarize Count = count() by bin (StartTime, 8h) | render timechart
Měli byste získat výsledky, které vypadají jako na následujícím obrázku:
Podívejte se na výsledný graf. Vidíte nějaké zjevné mezery nebo anomálie?
Události podle stavu
Dalším způsobem, jak se podívat na distribuci dat, je seskupit podle umístění události (v tomto případě stav) a zjistit, jaký druh trendů je možné pochopit z distribuce.
Spusťte tento dotaz:
StormEvents | summarize event = count() by State | sort by event | render barchart
Měli byste získat výsledky, které vypadají jako na následujícím obrázku:
Podívejte se na výsledný graf. V seznamu je 67 různých států, včetně těch, které nejsou oficiálními státy v USA, například "Americká Samoa" a "Havajská voda". Dává tento typ geografické distribuce bouře smysl?
Podkladová data můžete zobrazit tak , že vyberete kartu Tabulka nad grafem. Pomáhají vám skutečná čísla lépe porozumět distribuci dat?
Události podle zeměpisné polohy
Viděli jste, jak se počet událostí liší podle času a stavu. Připomeňme si, že mapování schématu ukázalo, že každá položka události storm obsahuje latitudinální a podélné informace. Pojďme se podívat, jak se datové clustery na mapě.
Následující dotaz seskupí události podle geografické buňky a spočítá počet událostí v každé buňce. Tyto výsledky se zobrazí na mapě, kde velikost kruhu odpovídá počtu událostí v buňce. Spusťte tento dotaz:
StormEvents | project BeginLon, BeginLat | where isnotnull(BeginLat) and isnotnull(BeginLon) | summarize count_summary=count() by hash = geo_point_to_s2cell(BeginLon, BeginLat,6) | project geo_s2cell_to_central_point(hash), count_summary | extend Events = "count" | render piechart with (kind = map)
Měli byste získat výsledky, které vypadají jako na následujícím obrázku:
Zkuste přiblížit stisknutím kláves Ctrl+. Teď, když jste viděli typy bouří reprezentovaných, dává smysl, že v oblasti USA a mexického zálivu existuje více těchto typů bouří?