avg agregační funkce

Platí pro: zaškrtnutí označeného ano Databricks SQL zaškrtnutí označeného ano Databricks Runtime

Vrátí střední hodnotu vypočítanou z hodnot skupiny. Tato funkce je synonymem pro střední agregační funkci.

Syntaxe

avg( [ALL | DISTINCT] expr) [FILTER ( WHERE cond ) ]

Tuto funkci lze také vyvolat jako funkci okna pomocí OVER klauzule.

Argumenty

  • expr: Výraz, který se vyhodnotí jako číselný nebo interval.
  • cond: Volitelný logický výraz filtrující řádky použité pro agregaci.

Návraty

Typ výsledku se vypočítá jako argumenty:

  • DECIMAL(p, s): Typ výsledku je a DECIMAL(p + 4, s + 4). Pokud dosáhnete maximální přesnosti funkce DECIMAL, bude zvýšení měřítka omezené, aby nedošlo ke ztrátě významných číslic.
  • year-month interval: Výsledek je .INTERVAL YEAR TO MONTH
  • denní časový interval: Výsledek je .INTERVAL DAY TO SECOND
  • Ve všech ostatních případech je výsledkem double.

Hodnoty Null v rámci skupiny se ignorují. Pokud je skupina prázdná nebo se skládá pouze z hodnot null, výsledek je NULL.

Pokud DISTINCT je zadaný průměr, vypočítá se po odebrání duplicit.

Pokud výsledek přeteče typ výsledku, Azure Databricks vyvolá ARITHMETIC_OVERFLOW chybu. Pokud chcete vrátit hodnotu NULL, použijte místo toho try_avg.

Upozorňující

Pokud je ve službě Databricks Runtime spark.sql.ansi.enabled false, vrátí NULL se místo chyby přetečení.

Příklady

> SELECT avg(col) FROM VALUES (1), (2), (3) AS tab(col);
 2.0

> SELECT avg(DISTINCT col) FROM VALUES (1), (1), (2) AS tab(col);
 1.5

> SELECT avg(col) FROM VALUES (1), (2), (NULL) AS tab(col);
 1.5

> SELECT avg(col) FROM VALUES (INTERVAL '1' YEAR), (INTERVAL '2' YEAR) AS tab(col);
 1-6

-- Overflow results in NULL for try_avg()
> SELECT try_avg(col) FROM VALUES (5e37::DECIMAL(38, 0)), (5e37::DECIMAL(38, 0)) AS tab(col);
 NULL

-- Overflow causes error for avg() in ANSI mode.
> SELECT avg(col) FROM VALUES (5e37::DECIMAL(38, 0)), (5e37::DECIMAL(38, 0)) AS tab(col);
 Error: CANNOT_CHANGE_DECIMAL_PRECISION