Cvičení: První seznámení s daty

Dokončeno

Vzpomeňte si, že v našem scénáři jste narazili na novou datovou sadu, která obsahuje meteorologické informace o bouřích v USA. V této lekci získáte počáteční pohled na samotná data.

Podívejte se na nezpracovaná data.

První věcí, kterou chcete udělat, je podívat se na skutečná data a zjistit, které sloupce existují, jaký typ dat jsou v těchto sloupcích a jaké možné hodnoty existují. Nemusíte vidět každý řádek v tabulce dat, takže si vezměme malý výběr celé tabulky.

  1. Spuštěním následujícího dotazu vezměte 50 libovolných řádků dat.

    Spuštění dotazu

    StormEvents
    | take 50
    

    Měli byste získat výsledky, které vypadají jako na následujícím obrázku, i když se konkrétní řádky, které vidíte, můžou lišit:

    Snímek obrazovky zobrazující výsledky pořízení 50query

  2. Podívejte se na výslednou tabulku pod dotazem v tom, co se nazývá mřížka Výsledků. Posuňte se na pravou stranu a poznamenejte si všechny sloupce. Můžete získat představu o typech dat a rozsahů hodnot v těchto sloupcích? Nezapomeňte, že zobrazená pole jsou jen vzorkováním celé tabulky.

Změna uspořádání dat pomocí mřížky výsledků

Mřížka výsledků nabízí řadu integrovaných nástrojů, které jsou pravděpodobně známé akce z jiných prostředí. Data můžete například seřadit podle určitého sloupce.

Každý z následujících příkladů začíná výsledky dotazu take 50 .

Seřazení dat ve sloupci

Pokud chcete řadit podle konkrétního sloupce, vyberte název tohoto sloupce v mřížce výsledků. Šipka, která se zobrazí napravo od názvu sloupce, označuje, jestli je seřazená vzestupně nebo sestupně.

  1. Vyberte sloupec Stát.

    Snímek obrazovky zobrazující sloupce seřazené podle sloupce stavu

  2. Podívejte se na výsledný seznam. Zobrazují se v několika řádcích nějaké stavy? Mějte na paměti, že se díváte na 50 řádků, které jste vybrali výše, takže byste neměli očekávat, že se zobrazí úplný seznam.

Seskupení výsledků

Seřazení dat o krok dál můžete seskupit (nebo agregovat) výsledky podle společných polí. Můžete si vzpomenout, že výše seřazený seznam dal několik položek pro různé státy.

  1. Vyberte ikonu nabídky napravo od sloupce, který chcete seřadit. V tomto případě vyberte nabídku na pravé straně sloupce Stát .
  2. Vyberte Seskupovat podle státu.
  3. Za každým stavem následuje počet přidružených položek. Výběrem šipky vlevo od názvu státu tyto položky rozbalíte.

Snímek obrazovky znázorňující proces výběru stavu a seskupení podle stavu ve webovém uživatelském rozhraní Azure Data Exploreru

Výběr podmnožina dat

Teď, když máte představu o tom, jaký druh dat v tabulce existuje, můžete vybrat podmnožinu těchto dat; Například pouze zahlcené události.

  1. Ve sloupci EventType vyberte události, na kterých chcete filtrovat. Podržte klávesu Shift na klávesnici, abyste vybrali více událostí, jako je například blesková záplava, heavy rain a Flood.
  2. Klikněte pravým tlačítkem myši na vybrané pole a vyberte Přidat výběr jako filtry. Předchozí dotaz se změní a přidá filtrovaná pole.
  3. Znovu spusťte dotaz výběrem tlačítka Spustit . Všechny výsledné události jsou teď jedním z vybraných typů.

Snímek obrazovky znázorňující výběr buněk a přidání výběru jako filtrů v dotazu

Filtrování podle hodnoty

Můžete také filtrovat jednu hodnotu. Pojďme se podívat na všechny události, ke kterým došlo ve státě Ohio.

  1. Vyberte ikonu nabídky napravo od sloupce Stát .

  2. Vyberte ikonu trychtýře.

  3. I když byste mohli hledat libovolný typ řetězce nebo celé číslo, budete chtít vyhledat libovolný sloupec, který obsahuje slovo Ohio. Tento filtr můžete použít také k vyhledání neúplných nebo prázdných datových polí.

    Snímek obrazovky s rozevíracím seznamem řetězcových operátorů

  4. Pod typem filtrování zadejte slovo Ohio. Všimněte si, že výsledky se okamžitě filtrují.

    Snímek obrazovky zobrazující filtr sloupců pro řetězcovou hodnotu

Shrnutí vybraných buněk

V pravém dolním rohu mřížky výsledků jsou vybrané buňky shrnuty. Když vyberete celočíselné hodnoty, zobrazí se také statistický souhrn těchto hodnot.

  1. Posuňte se do sloupce DamageProperty v mřížce výsledků.

  2. Klikněte a přetáhněte výběr buněk v tomto sloupci. Tyto buňky budou zvýrazněny modrým pozadím, které označuje výběr.

  3. Podívejte se do pravého dolního rohu mřížky výsledků. Jaké jsou zobrazené maximální a minimální hodnoty? Pomůže vám tento souhrn pochopit oblast dat v tomto sloupci?

    Snímek obrazovky zobrazující statistický souhrn vybraných celočíselné buňky

Rozbalení dynamického pole

Posuňte se k poslednímu sloupci v tabulce dat. Vidíte sloupec StormSummary ? Toto pole obsahuje velké množství dat, která nejsou všechna viditelná. Buňku můžete rozbalit a zobrazit všechny informace uvnitř dynamického pole.

  1. Vyberte ikonu Rozbalit zobrazení v pravém horním rohu mřížky výsledků.

  2. Výběrem možnosti Vpravo zobrazíte rozbalené výsledky v pravém podokně.

  3. Posuňte se k nejpravnějšímu sloupci tabulky StormSummary.

  4. Poklikejte na jedno z polí v tomto sloupci. Pole se rozbalí a zobrazí obsah ve čitelnějším formátu:

    Snímek obrazovky s rozbalením dynamického pole souhrnu stormu