avg
agregační funkce
Platí pro: Databricks SQL Databricks Runtime
Vrátí střední hodnotu vypočítanou z hodnot skupiny. Tato funkce je synonymem pro střední agregační funkci.
Syntaxe
avg( [ALL | DISTINCT] expr) [FILTER ( WHERE cond ) ]
Tuto funkci lze také vyvolat jako funkci okna pomocí OVER
klauzule.
Argumenty
expr
: Výraz, který se vyhodnotí jako číselný nebo interval.cond
: Volitelný logický výraz filtrující řádky použité pro agregaci.
Návraty
Typ výsledku se vypočítá jako argumenty:
DECIMAL(p, s)
: Typ výsledku je aDECIMAL(p + 4, s + 4)
. Pokud dosáhnete maximální přesnosti funkce DECIMAL, bude zvýšení měřítka omezené, aby nedošlo ke ztrátě významných číslic.- year-month interval: Výsledek je .
INTERVAL YEAR TO MONTH
- denní časový interval: Výsledek je .
INTERVAL DAY TO SECOND
- Ve všech ostatních případech je výsledkem double.
Hodnoty Null v rámci skupiny se ignorují. Pokud je skupina prázdná nebo se skládá pouze z hodnot null, výsledek je NULL.
Pokud DISTINCT
je zadaný průměr, vypočítá se po odebrání duplicit.
Pokud výsledek přeteče typ výsledku, Azure Databricks vyvolá ARITHMETIC_OVERFLOW chybu. Pokud chcete vrátit hodnotu NULL, použijte místo toho try_avg.
Upozorňující
Pokud je ve službě Databricks Runtime spark.sql.ansi.enabled false
, vrátí NULL
se místo chyby přetečení.
Příklady
> SELECT avg(col) FROM VALUES (1), (2), (3) AS tab(col);
2.0
> SELECT avg(DISTINCT col) FROM VALUES (1), (1), (2) AS tab(col);
1.5
> SELECT avg(col) FROM VALUES (1), (2), (NULL) AS tab(col);
1.5
> SELECT avg(col) FROM VALUES (INTERVAL '1' YEAR), (INTERVAL '2' YEAR) AS tab(col);
1-6
-- Overflow results in NULL for try_avg()
> SELECT try_avg(col) FROM VALUES (5e37::DECIMAL(38, 0)), (5e37::DECIMAL(38, 0)) AS tab(col);
NULL
-- Overflow causes error for avg() in ANSI mode.
> SELECT avg(col) FROM VALUES (5e37::DECIMAL(38, 0)), (5e37::DECIMAL(38, 0)) AS tab(col);
Error: CANNOT_CHANGE_DECIMAL_PRECISION