Výstup Azure Data Exploreru z Azure Stream Analytics

Azure Data Explorer můžete použít jako výstup pro analýzu velkých objemů různorodých dat z libovolného zdroje dat, jako jsou weby, aplikace a zařízení IoT (Internet of Things). Azure Data Explorer je rychlá a vysoce škálovatelná služba pro zkoumání dat protokolů a telemetrie. Pomáhá zpracovávat mnoho datových proudů, které moderní software generuje, abyste mohli shromažďovat, ukládat a analyzovat data. Tato data se používají pro diagnostiku, monitorování, vytváření sestav, strojové učení a další možnosti analýzy.

Azure Data Explorer podporuje několik metod příjmu dat, včetně konektorů pro běžné služby, jako jsou Azure Event Hubs, programového příjmu prostřednictvím sad SDK, jako jsou .NET a Python, a přímý přístup k modulu pro účely zkoumání. Azure Data Explorer se integruje se službami analýzy a modelování, díky čemuž umožňuje provádět rozšířené analýzy a vizualizace dat.

Další informace o Azure Data Exploreru najdete v tématu Co je Azure Data Explorer?

Další informace o tom, jak vytvořit cluster Azure Data Exploreru pomocí webu Azure Portal, najdete v tématu Rychlý start: Vytvoření clusteru a databáze Azure Data Exploreru.

Poznámka:

Azure Data Explorer z Azure Stream Analytics podporuje výstup do Azure Synapse Data Exploreru. Pokud chcete zapisovat do clusterů v Průzkumníku dat Azure Synapse, zadejte adresu URL clusteru v podokně konfigurace výstupu Azure Data Exploreru v úloze Azure Stream Analytics.

Konfigurace výstupu

Následující tabulka uvádí názvy vlastností a jejich popisy pro vytvoření výstupu Azure Data Exploreru.

Název vlastnosti Popis
Alias pro výstup Popisný název, který se používá v dotazech k nasměrování výstupu dotazu do této databáze.
Předplatné Předplatné Azure, které chcete použít pro váš cluster.
Cluster Jedinečný název, který identifikuje váš cluster. Název domény <region.kusto.windows.net> se připojí k zadanému názvu clusteru. Název může obsahovat jenom malá písmena a číslice. Musí obsahovat 4 až 22 znaků.
Databáze Název databáze, do které odesíláte výstup. Název databáze musí být v rámci clusteru jedinečný.
Authentication Spravovaná identita z Microsoft Entra ID, která vašemu clusteru umožňuje snadný přístup k dalším prostředkům chráněným microsoftem Entra, jako je Azure Key Vault. Identitu spravuje platforma Azure a nevyžaduje, abyste zřizovali nebo rotovali tajné kódy. Konfigurace spravované identity se v současné době podporuje jenom kvůli povolení klíčů spravovaných zákazníkem pro váš cluster.
Table Název tabulky, do které se zapisuje výstup. V názvu tabulky se rozlišují malá a velká písmena. Schéma této tabulky by mělo přesně odpovídat počtu polí a jejich typům, které výstup úlohy vygeneruje.

dělení na části

Je potřeba povolit dělení a je založená na PARTITION BY klauzuli v dotazu. Pokud je povolená možnost Dědit dělení, řídí se vstupním dělením pro plně paralelizovatelné dotazy.

Kdy použít Azure Stream Analytics a Azure Data Explorer

Mezi charakteristiky Azure Stream Analytics patří:

  • Modul pro zpracování datových proudů: průběžná analýza v reálném čase
  • Na základě úlohy
  • Okno zpětného vyhledávání o 1 milisekundách až 7 dnů pro dočasnou analýzu v paměti a zpracování datových proudů
  • Příjem dat ze služby Azure Event Hubs a Azure IoT Hubu s nízkou latencí

Mezi charakteristiky Azure Data Exploreru patří:

  • Analytický modul: interaktivní analýza v reálném čase na vyžádání
  • Streamování příjmu dat do trvalého úložiště dat spolu s možnostmi dotazování
  • Příjem dat ze služeb Event Hubs, IoT Hub, Azure Blob Storage, Azure Data Lake Storage, Kafka, Logstash, Spark a Azure Data Factory
  • Latence 10 sekund až 5 minut pro úlohy s vysokou propustností
  • Jednoduchá transformace dat prostřednictvím zásad aktualizace během příjmu dat

Rozsah analýz v reálném čase můžete výrazně rozšířit pomocí Azure Stream Analytics a Azure Data Exploreru společně. Tady je několik scénářů:

  • Stream Analytics identifikuje anomálie v reálném čase a Azure Data Explorer pomáhá určit, jak a proč k nim došlo prostřednictvím interaktivního zkoumání.
  • Stream Analytics deserializuje příchozí datové proudy pro použití v Azure Data Exploreru (například formát ingest Protobuf pomocí vlastního deserializátoru nebo vlastních binárních formátů).
  • Stream Analytics může agregovat, filtrovat, rozšiřovat a transformovat příchozí datové proudy pro použití v Azure Data Exploreru.

Další scénáře a omezení

  • Název sloupců a datových typů by se měl shodovat s dotazem SQL azure Stream Analytics a tabulkou Azure Data Exploreru. V porovnání se rozlišují malá a velká písmena.
  • Sloupce, které existují v clusterech Azure Data Exploreru, ale v Azure Stream Analytics chybí, se ignorují. Sloupce, které v Azure Stream Analytics chybí, vyvolávají chybu.
  • Pořadí sloupců v dotazu Azure Stream Analytics nezáleží. Schéma tabulky Azure Data Exploreru určuje pořadí.
  • Azure Data Explorer má zásadu agregace (dávkování) pro příjem dat, která je navržená tak, aby optimalizovala proces příjmu dat. Ve výchozím nastavení je zásada nakonfigurovaná na 5 minut, 1 000 položek nebo 1 GB dat, takže můžete zaznamenat latenci. Pokud chcete snížit latenci, povolte příjem dat streamování v clusteru a potom tabulku nebo databázi podle pokynů v tématu Konfigurace příjmu streamovaných dat v clusteru Azure Data Exploreru. Možnosti agregace najdete v tématu Zásady příjmu dat.

Další kroky