Streamování v Azure Databricks

Azure Databricks můžete použít k příjmu dat téměř v reálném čase, ke zpracování, strojovému učení a umělé inteligenci pro streamování dat.

Azure Databricks nabízí řadu optimalizací pro streamování a přírůstkové zpracování, včetně následujících:

Delta Lake poskytuje vrstvu úložiště pro tyto integrace. Viz čtení a zápisy streamovaných tabulek Delta.

Informace o poskytování modelu v reálném čase najdete v tématu Model obsluhující službu Azure Databricks.

  • Kurz

    Seznamte se se základy téměř v reálném čase a přírůstkového zpracování pomocí strukturovaného streamování v Azure Databricks.

  • Koncepty

    Seznamte se se základními koncepty konfigurace přírůstkových úloh a úloh téměř v reálném čase pomocí strukturovaného streamování.

  • Stavové streamování

    Správa průběžných informací o stavových dotazech strukturovaného streamování může pomoct zabránit neočekávaným problémům s latencí a produkčním prostředím.

  • Důležité informace o produkčním prostředí

    Tento článek obsahuje doporučení ke konfiguraci úloh přírůstkového zpracování v produkčním prostředí se strukturovaným streamováním v Azure Databricks, aby splňovaly požadavky na latenci a náklady pro aplikace v reálném čase nebo dávkové aplikace.

  • Monitorování datových proudů

    Naučte se monitorovat aplikace strukturovaného streamování v Azure Databricks.

  • Integrace katalogu Unity

    Naučte se využívat katalog Unity ve spojení se strukturovaným streamováním v Azure Databricks.

  • Streamování s využitím Delta

    Naučte se používat tabulky Delta Lake jako zdroje streamování a jímky.

  • Příklady

    Podívejte se na příklady použití strukturovaného streamování Sparku s Využitím Cassandra, Azure Synapse Analytics, poznámkových bloků Pythonu a poznámkových bloků Scala v Azure Databricks.

Azure Databricks má specifické funkce pro práci s částečně strukturovanými datovými poli obsaženými v Avro, vyrovnávací paměti protokolu a datových částech JSON. Další informace najdete v následujících tématech:

Další materiály

Apache Spark poskytuje průvodce programováním strukturovaného streamování, který obsahuje další informace o strukturovaném streamování.

Referenční informace o strukturovaném streamování doporučuje Databricks následující odkazy na rozhraní Apache Spark API: