Integrované funkce

Platí pro: zaškrtnutí označeného ano Databricks SQL zaškrtnutí označeného ano Databricks Runtime

Tento článek obsahuje odkazy na předdefinované operátory a funkce pro řetězce a binární typy, číselné skaláry, agregace, okna, pole, mapy, kalendářní data a časová razítka, přetypování, data CSV, data JSON, manipulace s XPathem a další různé funkce.

V případě případů použití, které existující předdefinované funkce nepodporují, zvažte definování vlastní funkce. Podívejte se, co jsou uživatelem definované funkce (UDF)?

Další zdroje informací:

Operátory a predikáty

Informace o tom, jak se operátory analyzují s ohledem na sebe, naleznete v tématu Priorita operátoru.

Operátor Syntaxe Popis
& expr1 & expr2 Vrátí bitovou ručičku AND expr1 a expr2.
and expr1 and expr2 Vrátí logickou AND hodnotu expr1 a expr2.
* multiplier * multiplicand Vrátí multiplier hodnotu vynásobenou multiplicand.
!= expr1 != expr2 Vrátí hodnotu true, pokud expr1 se nerovná expr2nebo false jinak.
! !expr Vrátí logickou NOT hodnotu logického výrazu.
mezi expr1 [not] between expr2 and expr2 Testuje, zda expr1 je větší nebo rovno expr2 a menší než nebo rovno expr3.
[ ] arrayExpr [ indexExpr ] Vrátí indexExprdruhý prvek funkce ARRAY arrayExpr.
[ ] mapExpr [ keyExpr ] Vrátí hodnotu v keyExpr hodnotě MAP mapExpr.
^ expr1 ^ expr2 Vrátí bitovou bitové souslu a OR (XOR) expr1 expr2.
: jsonStr : jsonPath Vrátí pole extrahovaná z objektu jsonStr.
:: expr :: type Přetypuje hodnotu expr na cílový datový typ type.
?:: expr ?:: type Pokud je to možné, přetypuje hodnotu expr na cílový datový typ type , vrátí NULL v opačném případě hodnotu.
div dividend div divisor Vrátí celočíselnou část dělení dividend podle divisor.
. mapExpr . keyIdentifier MAP Vrátí hodnotu podle keyIdentifier.
. structExpr . fieldIdentifier STRUCT Vrátí pole podle fieldIdentifier.
== expr1 == expr2 Vrátí true hodnotu, pokud expr1 se rovná expr2, nebo false jinak.
= expr1 = expr2 Vrátí true hodnotu, pokud expr1 se rovná expr2, nebo false jinak.
>= expr1 >= expr2 Vrátí true hodnotu, pokud expr1 je větší nebo rovna expr2, nebo false jinak.
> expr1 > expr2 Vrátí true , pokud expr1 je větší než expr2, nebo false jinak.
existuje exists(query) Vrátí hodnotu true, pokud query vrátí alespoň jeden řádek nebo nepravda jinak.
ilike str [not] ilike (pattern[ESCAPE escape]) Vrátí hodnotu true, pokud str se (ne) neshoduje pattern s rozlišováním escape malých a velkých písmen.
ilike str [not] ilike {ANY\|SOME\|ALL}([pattern[, ...]]) Vrátí hodnotu true, pokud str (ne) neodpovídá žádným nebo všem vzorům nerozlišuje malá a velká písmena.
v elem [not] in (expr1[, ...]) Vrátí true hodnotu, pokud elem se (ne) rovná žádné exprN.
v elem [not] in (query) Vrátí true hodnotu, pokud elem se (ne) rovná žádnému řádku v query.
je odlišný. expr1 is [not] distinct from expr2 Testuje, zda argumenty neobsahují různé hodnoty, ve kterých NULLjsou považovány za srovnatelné hodnoty.
je false expr is [not] false Testuje, zda expr je (ne) false.
má hodnotu null. expr is [not] null Vrátí true , pokud expr je (není) NULL.
je true expr is [not] true Testuje, zda expr je (ne) true.
jako str [not] like (pattern[ESCAPE escape]) Vrátí hodnotu true, pokud str (není) shodná pattern s escape.
jako str [not] like {ANY\|SOME\|ALL}([pattern[, ...]]) Vrátí hodnotu true, pokud str (ne) odpovídá žádnému nebo všem vzorům.
<=> expr1 <=> expr2 Vrátí stejný výsledek jako EQUAL(=) pro operandy, které nejsou null, ale vrátí true , pokud jsou NULLoba , false pokud jeden z nich je NULL.
<= expr1 <= expr2 Vrátí true hodnotu, pokud expr1 je menší nebo rovna expr2, nebo false jinak.
<> expr1 <> expr2 Vrátí true hodnotu, pokud expr1 se nerovná expr2nebo false jinak.
< expr1 < expr2 Vrátí true hodnotu, pokud expr1 je menší než expr2, nebo false jinak.
- expr1 - expr2 Vrátí odčítání expr2 od expr1.
not not expr Vrátí logickou NOT hodnotu logického výrazu.
nebo expr1 or expr2 Vrátí logickou OR hodnotu expr1 a expr2.
% dividend % divisor Vrátí zbytek za dividend / divisor.
|| expr1 \|\| expr2 Vrátí zřetězení a expr1 expr2.
| expr1 \| expr2 Vrátí bitovou ručičku OR expr1 a expr2.
+ expr1 + expr2 Vrátí součet a expr1 expr2.
regexp str [not] regexp regex Vrátí hodnotu true, pokud str (není) shoda regex.
regexp_like str [not] regexp_like regex Vrátí hodnotu true, pokud str (není) shoda regex.
rlike str [not] rlike regex Vrátí hodnotu true, pokud str (není) shoda regex.
/ dividend / divisor Vrátí dividend hodnotu dělenou .divisor
~ ~ expr Vrátí bitovou ručičku NOT expr.

Priorita operátorů

Pořadí podle priority Operátor
0 :, ::, , ?::[ ]
2 -(unární), +(unární), ~
3 *, /, , %div
4 +, , -\|\|
5 &
6 ^
7 \|
8 =, ==, , <><<=<=>!=, , >>=
9 not, exists
10 between, in, rlike, , ilikeregexp, like, , is [not] [NULL, true, false]is [not] distinct from
11 and
12 or

Řetězcové a binární funkce

Function Popis
výraz1 || výraz2 Vrátí zřetězení a expr1 expr2.
aes_decrypt(výraz, klíč[; režim[; odsazení[; aad]]) Dešifruje binární soubor expr pomocí šifrování AES.
aes_encrypt(výraz, klíč[; režim[; odsazení[, iv[, aad]]]) Zašifruje binární soubor expr pomocí šifrování AES.
ascii(str) Vrátí bod kódu ASCII prvního znaku znaku str.
base64(výraz) expr Převede se na základní řetězec 64.
bin(výraz) Vrátí binární reprezentaci .expr
binary(výraz) Přetypuje hodnotu expr na BINARYhodnotu .
bit_length(výraz) Vrátí bitovou délku řetězcových dat nebo počet bitů binárních dat.
bitmap_count(výraz) Vrátí počet bitů nastavených v BINARY řetězci představující rastrový obrázek.
btrim(str [, trimStr]) Vrátí s str odebranými počátečními a koncovými znaky.
char(výraz) Vrátí znak v zadaném bodě kódu UTF-16.
char_length(výraz) Vrátí délku znaku řetězcových dat nebo počet bajtů binárních dat.
character_length(výraz) Vrátí délku znaku řetězcových dat nebo počet bajtů binárních dat.
charindex(podstr; str[, pos]) Vrátí pozici prvního výskytu substr po str pozici pos.
chr(výraz) Vrátí znak v zadaném bodě kódu UTF-16.
concat(výraz1, výraz2[; ...]) Vrátí zřetězení argumentů.
concat_ws(sep[; výraz1[; ...]]) Vrátí řetězce zřetězení oddělené znakem sep.
contains(výraz, subExpr) Vrátí true hodnotu pokud expr STRING nebo BINARY obsahuje subExpr.
crc32(výraz) Vrátí hodnotu kontroly exprcyklické redundance .
decode(výraz, charSet) Přeloží binární expr soubor na řetězec pomocí kódování charSetznakové sady .
encode(výraz, charSet) Vrátí binární reprezentaci řetězce pomocí charSet kódování znaků.
endswith(výraz, endExpr) Vrátí true , pokud expr STRING nebo BINARY končí na endExpr.
find_in_set(searchExpr, sourceExpr) Vrátí pozici řetězce v seznamu řetězců oddělených čárkami.
format_number(výraz, měřítko) Formáty expr jako #,###,###.##, zaokrouhlené na scale desetinná místa.
format_number(výraz, fmt) Formáty expr jako fmt.
format_string(strfmt[; obj1 [; ...]]) Vrátí formátovaný řetězec z řetězců formátu printf.style.
hex(výraz) expr Převede na šestnáctkové.
str ilike (vzor[ESCAPE escape]) Vrátí hodnotu true, pokud str se porovnává pattern s rozlišováním escape malých a velkých písmen.
initcap(expr) Vrátí expr první písmeno každého slova velkými písmeny.
instr(str, substr) Vrátí index (1) prvního výskytu substr hodnoty in str.
lcase(výraz) Vrátí expr všechny znaky změněné na malá písmena.
left(str, délka) Vrátí znaky nejvíce len vlevo od str.
Délka(výraz) Vrátí délku znaku řetězcových dat nebo počet bajtů binárních dat.
length(výraz) Vrátí délku znaku řetězcových dat nebo počet bajtů binárních dat.
levenshtein(str1, str2) Vrátí vzdálenost Levenshtein mezi řetězci str1 a str2.
str like (vzor[ESCAPE escape]) Vrátí hodnotu true, pokud str odpovídá pattern hodnotě escape.
locate(substr; str[, pos]) Vrátí pozici prvního výskytu substr po str pozici pos.
lower(výraz) Vrátí expr všechny znaky změněné na malá písmena.
lpad(výraz, délka[, pad]) Vrátí exprlevou pad část s délkou len.
ltrim([trimstr;] str) Vrátí str s úvodními znaky v trimStr rámci odebraných znaků.
mask(str[, upperChar[, lowerChar[, digitChar[, otherChar]]]] Vrátí maskovanou verzi vstupu str.
md5(výraz) Vrátí kontrolní součet MD5 128 bitů expr jako šestnáctkový řetězec.
octet_length(výraz) Vrátí délku bajtu řetězcových dat nebo počet bajtů binárních dat.
překrytí(vstupní UMÍSTĚNÍ nahradit FROM pos [FOR len]) input Nahrazuje tímreplace, že začíná pos a má délku len.
parse_url(url, partToExtract[, klíč]) Extrahuje část z url.
position(substr; str[, pos]) Vrátí pozici prvního výskytu substr po str pozici pos.
position(subtr IN str) Vrátí pozici prvního výskytu substr po str pozici pos.
printf(strfmt[, obj1 [; ...]]) Vrátí formátovaný řetězec z řetězců formátu printf.style.
str regexp regex Vrátí hodnotu true, pokud str odpovídá regex.
str regexp_like regex Vrátí hodnotu true, pokud str odpovídá regex.
regexp_count(str, regexp) Vrátí počet, kolikrát str odpovídá regexp vzoru.
regexp_extract(str, regexp[, idx]) Extrahuje první řetězec odpovídající str výrazu regexp a odpovídá indexu regex skupiny.
regexp_extract_all(str, regexp[, idx]) Extrahuje všechny řetězce odpovídající str výrazu regexp a odpovídá indexu regex skupiny.
regexp_instr(str, regexp) Vrátí pozici prvního podřetětětce, str který odpovídá regexp.
regexp_replace(str, regexp, rep[, position]) Nahradí všechny podřetětěce str , které odpovídají regexp rep.
regexp_substr(str, regexp) Vrátí první podřetětěr v str této shodě regexp.
repeat(výraz, n) Vrátí řetězec, který opakuje časy expr n .
replace(str, search [, replace]) Nahradí všechny výskyty search řetězcem replace.
reverse(výraz) Vrátí obrácený řetězec nebo pole s obráceným pořadím prvků.
right(str, délka) Vrátí nejvíce znaků z řetězce strvpravo len .
str rlike regex Vrátí hodnotu true, pokud str odpovídá regex.
rpad(výraz, délka[, pad]) Vrátí exprhodnotu zprava pad do pravé části s délkou len.
rtrim([trimStr;] str) Vrátí se str s odebranými koncovými znaky.
věty(str[, lang, země]) Rozdělí str na pole slov.
sha(výraz) Vrátí hodnotu hash sha1 jako šestnáctkový řetězec expr.
sha1(výraz) Vrátí hodnotu hash sha1 jako šestnáctkový řetězec expr.
sha2(výraz, bitLength) Vrátí kontrolní součet rodiny SHA-2 jako šestnáctkový řetězec expr.
soundex(výraz) Vrátí kód soundex řetězce.
mezera(n) Vrátí řetězec skládající se z n mezer.
split(str, regex[, limit]) Rozdělí str se kolem výskytů, které se shodují regex , a vrátí matici s délkou nejvýše limit.
split_part(str, delim, partNum) Rozdělí str se kolem výskytů delim a vrátí část partNum .
startswith(výraz, startExpr) Vrátí true , pokud expr STRING nebo BINARY začíná na startExpr.
string(výraz) Přetypuje hodnotu expr na STRINGhodnotu .
substr(výraz, pos[, len]) Vrátí podřetětěsce expr , který začíná pos a je dlouhý len.
substr(výraz FROM pos[ FOR len]) Vrátí podřetětěsce expr , který začíná pos a je dlouhý len.
substring(výraz, pos[, len]) Vrátí podřetětěsce expr , který začíná pos a je dlouhý len.
substring(výraz FROM pos[ FOR len]) Vrátí podřetětěsce expr , který začíná pos a je dlouhý len.
substring_index(výraz, delim; count) Vrátí podřetězenec expr před count výskyty oddělovače delim.
to_binary(výraz[; fmt]) Vrátí expr přetypování na binární hodnotu založenou na fmt.
to_char(numExpr, fmt) Vrátí numExpr přetypování na STRING použití formátování fmt."
to_varchar(numExpr, fmt) Vrátí numExpr přetypování na STRING použití formátování fmt."
translate(výraz, from, to) Vrátí místo expr , kde from byly nahrazeny všechny znaky v to.
trim([[OBĚ | ÚVODNÍ | KONCOVÉ] [trimStr] FROM] str) Oříznout znaky z řetězce
try_aes_decrypt(výraz, klíč[; režim[; odsazení[; aad]]) Dešifruje binární soubor expr pomocí šifrování AES a vrátí NULL v případě chyby.
try_to_binary(výraz [, fmt]) Vrátí expr přetypování BINARY na základě nebo NULL fmtpokud je vstup neplatný.
try_url_decode(str) Přeloží řetězec zpět z formátu application/x-www-form-urlencoded a vrátí v NULL případě chyby.
try_zstd_decompress(hodnota) Vrátí hodnotu dekomprimovanou kompresí Zstandard nebo NULL pokud je vstup neplatný.
ucase(výraz) Vrátí expr všechny znaky změněné na velká písmena.
unbase64(výraz) Vrátí dekódovaný řetězec base64 jako binární.
unhex(výraz) Převede šestnáctkové expr na BINARY.
upper(výraz) Vrátí expr všechny znaky změněné na velká písmena.
url_decode(str) Přeloží řetězec zpět z formátu application/x-www-form-urlencoded .
url_encode(str) Přeloží řetězec do formátu application/x-www-form-urlencoded .
zstd_compress (hodnota[;level[,streaming_mode]]) Vrátí hodnotu komprimovanou pomocí komprese Zstandard.
zstd_decompress(hodnota) Vrátí hodnotu dekomprimovanou pomocí komprese Zstandard.

Číselné skalární funkce

Function Popis
~ výraz Vrátí bitovou ručičku NOT expr.
dělitel/ dělitel Vrátí dividend hodnotu dělenou .divisor
výraz1 | výraz2 Vrátí bitovou ručičku OR expr1 a expr2.
- výraz Vrátí negovanou hodnotu expr.
výraz1 – výraz2 Vrátí odčítání expr2 od expr1.
+výraz Vrátí hodnotu expr.
výraz1 + výraz2 Vrátí součet a expr1 expr2.
dělitel dělitele v procentech dividend Vrátí zbytek za dividend / divisor.
výraz1 ^ výraz2 Vrátí bitovou bitové souslu a OR (XOR) expr1 expr2.
výraz1 a výraz2 Vrátí bitovou ručičku AND expr1 a expr2.
multiplikátor * multiplikátor Vrátí multiplier hodnotu vynásobenou multiplicand.
abs(výraz) Vrátí absolutní hodnotu číselné hodnoty v exprargumentu .
acos(výraz) Vrátí inverzní kosinus (arkusinus) .expr
acosh(výraz) Vrátí inverzní hyperbolický kosinus .expr
asin(výraz) Vrátí inverzní sinus (arkusinus) expr.
asinh(výraz) Vrátí inverzní hyperbolický sinus expr.
atan(výraz) Vrátí inverzní tangens (arkusangens) čísla expr.
atan2(výrazy, výrazx) Vrátí úhel v radiánech mezi kladnou osou x roviny a bodem určeným souřadnicemi (exprX, exprY).
atanh(výraz) Vrátí hyperbolický hyperbolický tangens .expr
bigint(výraz) Přetypuje hodnotu expr na BIGINThodnotu .
bit_count(výraz) Vrátí počet bitů nastavených v argumentu.
bit_get(výraz, pos) Vrátí hodnotu bitu v binární reprezentaci celočíselného číselného čísla.
bit_reverse(výraz) Vrátí hodnotu získanou vrácením pořadí bitů v argumentu.
bitmap_bit_position(výraz) Vrátí 0bitovou pozici daného BIGINT čísla v kontejneru.
bitmap_bucket_number(výraz) Vrátí číslo rastrového kbelíku pro dané BIGINT číslo.
bround(výraz[;targetScale]) Vrátí zaokrouhlenou hodnotu pomocí HALF_EVEN režimu zaokrouhleníexpr.
cbrt(výraz) Vrátí kořen datové krychle .expr
ceil(výraz[;targetScale]) Vrátí nejmenší číslo, které není menší než expr zaokrouhleno nahoru na číslice vzhledem k targetScale desetinné bodě.
ceiling(výraz[;targetScale]) Vrátí nejmenší číslo, které není menší než expr zaokrouhleno nahoru na číslice vzhledem k targetScale desetinné bodě.
conv(číslo, fromBase, toBase) num Převede z fromBase na toBase.
convert_timezone([sourceTz; ]targetTz, sourceTs) Převede z časového pásma TIMESTAMP_NTZ sourceTs sourceTz na .targetTz
cos(výraz) Vrátí kosinus .expr
cosh(výraz) Vrátí hyperbolický kosinus expr.
cot(výraz) Vrátí kotangens čísla expr.
csc(výraz) Vrátí kosekans čísla expr.
decimal(výraz) Přetypuje hodnotu expr na DECIMALhodnotu .
degrees(výraz) Převede radiány na stupně.
dělitel div dividenda Vrátí celočíselnou část dělení divisor podle dividend.
double(výraz) Přetypuje hodnotu expr na DOUBLEhodnotu .
e() Vrátí konstantu e.
výraz(výraz) Vrátí e mocninu expr.
výraz1(výraz) Vrací objekt exp(expr) - 1.
factorial(výraz) Vrátí faktoriál funkce expr.
float(výraz) Přetypuje hodnotu expr na FLOAThodnotu .
floor(výraz[;targetScale]) Vrátí největší číslo, které není menší než expr zaokrouhleno dolů na číslice vzhledem k targetScale desetinné bodě.
getbit(výraz, pos) Vrátí hodnotu bitu v binární reprezentaci celočíselného číselného čísla.
hypot(výraz1, výraz2) Vrací objekt sqrt(expr1 * expr1 + expr2 * expr2).
int(výraz) Přetypuje hodnotu expr na INTEGERhodnotu .
isnan(výraz) Vrátí true , pokud expr je NaN.
ln(výraz) Vrátí přirozený logaritmus (základ e) hodnoty expr.
log([base;] výraz) Vrátí logaritmus s expr base.
log1p(výraz) Vrací objekt log(1 + expr).
log2(výraz) Vrátí logaritmus základu expr 2.
log10(výraz) Vrátí logaritmus základu expr 10.
mod(dividenda, dělitel) Vrátí zbytek za dividend / divisor.
nanvl(výraz1, výraz2) Vrátí expr1 hodnotu, pokud není NaN, nebo expr2 jinak.
negative(výraz) Vrátí negovanou hodnotu expr.
'nullifzero(výraz)' Vrátí expr hodnotu, pokud není nula, nebo NULL jinak.
pí() Vrátí pí.
pmod(dividenda, dělitel) Vrátí kladné zbytek po dividend / divisor.
positive(výraz) Vrátí hodnotu expr.
pow(výraz1, výraz2) expr1 Zvyšuje moc .expr2
power(výraz1, výraz2) expr1 Zvyšuje moc .expr2
radiány(výraz) expr Převede stupně na radiány.
rand([počáteční]) Vrátí náhodnou hodnotu mezi 0 a 1.
randn([počáteční]) Vrátí náhodnou hodnotu ze standardního normálního rozdělení.
random([počáteční]) Vrátí náhodnou hodnotu mezi 0 a 1.
rint(výraz) Vrátí expr zaokrouhlené na celé číslo jako .DOUBLE
round(výraz[;targetScale]) Vrátí zaokrouhlenou hodnotu pomocí HALF_UP režimu zaokrouhleníexpr.
sec(výraz) Vrátí sekans .expr
shiftleft(výraz, n) Vrátí bitový levý posun o n bity.
shiftright(výraz, n) Vrátí celočíselné číslo s bitovým signedm signedem doprava posunutým o n bity.
shiftrightunsigned(výraz, n) Vrátí bitový celočíselný znaménk bez znaménka posunutý n o bity doprava.
sign(výraz) Vrátí hodnotu -1,0, 0,0 nebo 1,0, jak expr je záporná, 0 nebo kladná.
signum(výraz) Vrátí hodnotu -1,0, 0,0 nebo 1,0, jak expr je záporná, 0 nebo kladná.
sin(výraz) Vrátí sinus expr.
sinh(výraz) Vrátí hyperbolický sinus .expr
smallint(výraz) Přetypuje hodnotu expr na SMALLINThodnotu .
sqrt(výraz) Vrátí druhou odmocninu .expr
tan(výraz) Vrátí tangens .expr
tanh(výraz) Vrátí hyperbolický tangens .expr
tinyint(výraz) Přetypuje expr na TINYINT.
to_number(výraz, fmt ) Vrátí expr přetypování na DECIMAL použití formátování fmt.
try_add(výraz1, výraz2) Vrátí součet expr1 a expr2nebo NULL v případě chyby.
try_divide(dividenda, dělitel) Vrátí dividend hodnotu dělenou argumentem divisor, nebo NULL je-li divisor 0.
try_mod(dividenda, dělitel) Vrátí zbytek za dividend / divisor, nebo NULL pokud divisor je 0..
try_multiply(násobitel, násobitel) Vrátí multiplier hodnotu vynásobenou násobením multiplicandnebo NULL při přetečení.
try_subtract(výraz1, výraz2) Vrátí odčítání expr2 od expr1, nebo NULL při přetečení.
try_to_number(výraz, fmt ) Vrátí expr přetypování DECIMAL na použití formátování fmtnebo NULL pokud expr neodpovídá formátu.
width_bucket(výraz, minExpr, maxExpr, numBuckets) Vrátí číslo kontejneru pro hodnotu v histogramu s rovnou šířkou.
'zeroifnull(výraz)' Vrátí expr hodnotu, pokud není NULL, nebo 0 jinak.

Agregační funkce

Function Popis
any(výraz) Vrátí hodnotu true, pokud je pravdivá alespoň jedna hodnota expr ve skupině.
any_value(výraz[;ignoreNull]) Vrátí hodnotu expr pro skupinu řádků.
approx_count_distinct(výraz[;relativeSD]) Vrátí odhadovaný počet jedinečných hodnot ve expr skupině.
approx_percentile(výraz,procento[;přesnost]) Vrátí přibližný percentil expr skupiny.
approx_top_k(výraz[;k[;maxItemsTracked]]) Vrátí nejčastěji k se vyskytující hodnoty položek společně expr s jejich přibližnými počty.
array_agg(výraz) Vrátí matici, která se skládá ze všech hodnot v expr rámci skupiny.
avg(výraz) Vrátí střední hodnotu vypočítanou z hodnot skupiny.
bit_and(výraz) Vrátí bitovou hodnotu AND všech vstupních hodnot ve skupině.
bit_or(výraz) Vrátí bitovou hodnotu OR všech vstupních hodnot ve skupině.
bit_xor(výraz) Vrátí bitovou hodnotu XOR všech vstupních hodnot ve skupině.
bitmap_construct_agg(výraz) Vrátí bitovou hodnotu OR všech hodnot umístění bitů ve skupině. mezi 0 a 32767 ve skupině jako BINARY
bitmap_or_agg(výraz) Vrátí bitovou hodnotu OR všech BINARY vstupních hodnot ve skupině.
bool_and(výraz) Vrátí hodnotu true, pokud jsou všechny hodnoty ve expr skupině pravdivé.
bool_or(výraz) Vrátí hodnotu true, pokud je ve skupině pravdivá alespoň jedna hodnota expr .
collect_list(výraz) Vrátí matici, která se skládá ze všech hodnot v expr rámci skupiny.
collect_set(výraz) Vrátí matici, která se skládá ze všech jedinečných hodnot ve expr skupině.
corr(výraz1,výraz2) Vrátí Pearsonův koeficient korelace mezi skupinou číselných párů.
count(*) Vrátí celkový počet načtených řádků ve skupině, včetně řádků obsahujících hodnotu null.
count(výraz[; ...]) Vrátí počet řádků ve skupině, pro které jsou zadané výrazy všechny nenulové.
count_if(výraz) Vrátí počet hodnot true pro skupinu v expr.
count_min_sketch(column;epsilon;confidence;seed) Vrátí minimální náčrtek všech hodnot ve skupině column s epsilonhodnotou a confidence seed.
covar_pop(výraz1,výraz2) Vrátí kovarianci počtu dvojic čísel ve skupině.
covar_samp(výraz1,výraz2) Vrátí kovarianci vzorku dvojic čísel ve skupině.
every(výraz) Vrátí hodnotu true, pokud jsou splněny všechny hodnoty expr ve skupině.
first(výraz[;ignoreNull]) Vrátí první hodnotu expr pro skupinu řádků.
first_value(výraz[;ignoreNull]) Vrátí první hodnotu expr pro skupinu řádků.
histogram_numeric(výraz,numBins) Vypočítá histogram expr pomocí numBins intervalů a vrátí pole dvojic představujících středy přihrádek.
hll_sketch_agg(výraz[;lgConfigK]) Vrátí náčrtek HyperLogu použitý k přibližní počtu jedinečných hodnot.
hll_union_agg(výraz[;allowDifferentLgConfigK]) Agreguje náčrtky HyperLogu pro skupinu řádků.
kurtóza (výraz) Vrátí hodnotu kurtózy vypočítanou z hodnot skupiny.
last(výraz[;ignoreNull]) Vrátí poslední hodnotu expr pro skupinu řádků.
last_value(výraz[;ignoreNull]) Vrátí poslední hodnotu expr pro skupinu řádků.
max(výraz) Vrátí maximální hodnotu expr ve skupině.
max_by(výraz1;výraz2) Vrátí hodnotu přidružené k expr1 maximální hodnotě expr2 ve skupině.
mean(výraz) Vrátí střední hodnotu vypočítanou z hodnot skupiny.
medián (výraz) Vrátí medián vypočítaný z hodnot skupiny.
min(výraz) Vrátí minimální hodnotu expr ve skupině.
min_by(výraz1, výraz2) Vrátí hodnotu expr1 přidružené k minimální hodnotě expr2 ve skupině.
mode(výraz [;deterministic]) Vrátí nejčastější hodnotu, nikoli NULLhodnotu expr ve skupině.
percentil(výraz, procento [;frekvence]) Vrátí přesnou hodnotu percentilu zadané hodnoty expr percentage.
percentile_approx(výraz,procento[;přesnost]) Vrátí přibližný percentil expr skupiny.
percentile_cont(pct) WITHIN GROUP (KLÍČ ORDER BY) Vrátí interpolovaný percentil key uvnitř skupiny.
percentile_disc(pct) WITHIN GROUP (KLÍČ ORDER BY) Vrátí diskrétní percentil key uvnitř skupiny.
regr_avgx(yExpr, xExpr) Vrátí střední hodnotu xExpr vypočítanou z hodnot skupiny, kde xExpr a yExpr jsou NOT NULL.
regr_avgy(yExpr, xExpr) Vrátí střední hodnotu yExpr vypočítanou z hodnot skupiny, kde xExpr a yExpr jsou NOT NULL.
regr_count(yExpr, xExpr) Vrátí počet dvojic yExprhodnot, které nejsou null , xExpr ve skupině.
regr_intercept(yExpr, xExpr) Vrátí průsečík jedno-variate lineární regresní přímky ve skupině, kde xExpr a yExpr nejsou NULL.
regr_r2(yExpr, xExpr) Vrátí koeficient stanovení z hodnot skupiny, kde xExpr a yExpr nejsou NULL.
regr_slope(yExpr, xExpr) Vrátí sklon lineární regresní přímky párů nenulových yExprhodnot ve xExpr skupině.
regr_sxx(yExpr, xExpr) Vrátí součet čtverců xExpr hodnot skupiny, kde xExpr a yExpr nejsou NULL.
regr_sxy(yExpr, xExpr) Vrátí součet součinů z yExpr xExpr hodnot skupiny, kde xExpr a yExpr jsou NOT NULL.
regr_syy(yExpr, xExpr) Vrátí součet čtverců yExpr hodnot skupiny, kde xExpr a yExpr nejsou NULL.
schema_of_json_agg(json[; options]) Vrátí kombinované schéma JSON řetězců ve skupině ve formátu DDL.
schema_of_variant_agg(variantExpr) Vrátí kombinované schéma všech VARIANT hodnot ve skupině ve formátu DDL.
nerovnoměrná distribuce (výraz) Vrátí hodnotu nerovnoměrné distribuce vypočítanou z hodnot skupiny.
some(výraz) Vrátí hodnotu true, pokud je truealespoň jedna hodnota expr ve skupině .
std(výraz) Vrátí směrodatnou odchylku vzorku vypočítanou z hodnot ve skupině.
stddev(výraz) Vrátí směrodatnou odchylku vzorku vypočítanou z hodnot ve skupině.
stddev_pop(výraz) Vrátí směrodatnou odchylku základního souboru vypočítanou z hodnot skupiny.
stddev_samp(výraz) Vrátí směrodatnou odchylku vzorku vypočítanou z hodnot skupiny.
sum(výraz) Vrátí součet vypočítaný z hodnot skupiny.
try_avg(výraz) Vrátí střední hodnotu vypočítanou z hodnot skupiny, NULL pokud je přetečení.
try_sum(výraz) Vrátí součet vypočítaný z hodnot skupiny, NULL pokud je přetečení.
var_pop(výraz) Vrátí rozptyl základního souboru vypočítaný z hodnot skupiny.
var_samp(výraz) Vrátí rozptyl vzorku vypočítaný z hodnot skupiny.
variance(výraz) Vrátí rozptyl vzorku vypočítaný z hodnot skupiny.

Funkce okna řazení

Function Popis
dense_rank() Vrátí pořadí hodnoty ve srovnání se všemi hodnotami v oddílu.
ntile(n) Rozdělí řádky pro každý oddíl okna do n kbelíků v rozsahu od 1 do maximálně n.
percent_rank() Vypočítá procentuální hodnocení hodnoty v rámci oddílu.
rank() Vrátí pořadí hodnoty ve srovnání se všemi hodnotami v oddílu.
row_number() Přiřadí každému řádku jedinečné pořadové číslo, počínaje jedním podle pořadí řádků v rámci oddílu okna.

Analytické funkce oken

Function Popis
cume_dist() Vrátí pozici hodnoty vzhledem ke všem hodnotám v oddílu.
lag(výraz[;offset[;default]]) Vrátí hodnotu expr z předchozího řádku v rámci oddílu.
lead(expr[;offset[;default]]) Vrátí hodnotu z dalšího expr řádku v rámci oddílu.
nth_value(výraz; offset[; ignoreNulls]) Vrátí hodnotu expr v určitém offset okně.

Funkce pro práci s poli

Function Popis
arrayExpr[indexExpr] Vrátí prvek na pozici indexExpr funkce ARRAY arrayExpr.
aggregate(výraz,start,merge[;finish]) Agreguje prvky v poli pomocí vlastního agregátoru.
array([výraz [; ...]]) Vrátí matici s prvky v .expr
array_append(matice, elem) Vrátí array s příponou elem.
array_compact(pole) Odebere hodnoty NULL z array.
array_contains(matice;hodnota) Vrátí hodnotu true, pokud array obsahuje value.
array_distinct(matice) Odebere duplicitní hodnoty z array.
array_except(matice1;matice2) Vrátí pole prvků v array1 elementech, ale ne v array2.
array_insert(matice, index, elem) Vrátí rozbalené array místo, kam elem se vloží na index pozici.
array_intersect(matice1;matice2) Vrátí pole prvků v průsečíku array1 a array2.
array_join(matice,oddělovač[;nullReplacement]) Zřetězí prvky .array
array_max(matice) Vrátí maximální hodnotu v arrayhodnotě .
array_min(pole) Vrátí minimální hodnotu v arrayargumentu .
array_position(array;element) Vrátí pozici prvního výskytu element v array.
array_prepend(matice, elem) Vrátí array předsunutou elemhodnotu .
array_remove(array;element) Odebere všechny výskyty element z array.
array_repeat(element;count) Vrátí matici obsahující element count časy.
array_size(matice) Vrátí počet prvků v array.
array_sort(matice;func) Vrátí array seřazené podle func.
array_union(matice1;matice2) Vrátí pole prvků ve sjednocení array1 a array2 bez duplicit.
arrays_overlap(matice1; matice2) Vrátí hodnotu true, pokud průsečík array1 není array2 prázdný.
arrays_zip(matice1 [; ...]) Vrátí sloučenou matici struktur, ve kterých nth struktura obsahuje všechny Nth hodnoty vstupních polí.
kardinalita(výraz) Vrátí velikost expr.
concat(výraz1, výraz2 [; ...]) Vrátí zřetězení argumentů.
element_at(arrayExpr, index) Vrátí prvek znaku arrayExpr at index.
exists(výraz, pred) Vrátí hodnotu true, pokud pred je true pro libovolný prvek v expr.
explode(collection) Vrátí řádky zrušením vnoření .collection
explode_outer(kolekce) Vrátí řádky zrušením vnořením collection pomocí vnější sémantiky.
filter(výraz,func) Filtruje pole expr pomocí funkce func.
flatten(arrayOfArrays) Transformuje pole polí na jedno pole.
forall(výraz, predFunc) Testuje, zda predFunc je blokování pro všechny prvky v poli.
get(arrayExpr, index) Vrátí prvek znaku at počínaje znakem arrayExpr 0.index
inline(výraz) Rozloží pole struktur do tabulky.
inline_outer(výraz) Rozloží pole struktur do tabulky s vnější sémantikou.
posexplode(výraz) Vrátí řádky zrušením vnoření pole s počtem pozic.
posexplode_outer(výraz) Vrátí řádky zrušením vnořením pole s počtem pozic pomocí OUTER sémantiky.
reduce(výraz,start,merge[;finish]) Agreguje prvky v poli pomocí vlastního agregátoru.
reverse(array) Vrátí obrácený řetězec nebo pole s obráceným pořadím prvků.
sequence(start;stop;step) Vygeneruje pole prvků od start do stop (včetně) zvýšení o step.
shuffle(array) Vrátí náhodnou permutaci pole v expr.
size(výraz) Vrátí kardinalitu expr.
slice(výraz,začátek,délka) Vrátí podmnožinu pole.
sort_array(výraz[;ascendingOrder]) Vrátí matici v expr seřazeném pořadí.
transform(výraz, func) Transformuje prvky v poli expr pomocí funkce func.
try_element_at(arrayExpr, index) Vrátí prvek objektu arrayExpr at indexnebo NULL je-li index mimo vazbu.
zip_with(výraz1, výraz2, func) Sloučí pole do expr1 a expr2, prvek-moudrý, do jednoho pole pomocí func.

Mapové funkce

Function Popis
mapExpr[keyExpr] Vrátí hodnotu na keyExpr mapě mapExpr.
kardinalita(výraz) Vrátí velikost expr.
element_at(mapExpr, klíč) Vrátí hodnotu mapExpr pro key.
explode(výraz) Vrátí řádky zrušením vnoření .expr
explode_outer(výraz) Vrátí řádky zrušením vnořením expr pomocí vnější sémantiky.
map([{klíč1; hodnota1}[; ...]]) Vytvoří mapu se zadanými páry klíč-hodnota.
map_concat([výraz1 [; ...]]) Vrátí sjednocení všech expr výrazů mapování.
map_contains_key(mapa, klíč) Vrátí true , pokud map obsahuje key, false jinak.
map_entries(mapa) Vrátí neuspořádanou matici všech položek v map.
map_filter(výraz, func) Filtruje položky v mapě expr pomocí funkce func.
map_from_arrays(klíče, hodnoty) Vytvoří mapu s dvojicí keys polí a values polí.
map_from_entries(výraz) Vytvoří mapu vytvořenou ze zadaného pole položek.
map_keys(mapa) Vrátí neuspořádané pole obsahující klíče map.
map_values(mapa) Vrátí neseřazenou matici obsahující hodnoty map.
map_zip_with(mapa1, mapa2, func) Sloučí map1 a map2 sloučí do jedné mapy.
size(výraz) Vrátí kardinalitu expr.
str_to_map(výraz[;pairDelim[;keyValueDelim]]) Vrátí mapu po rozdělení expr na páry klíč-hodnota pomocí oddělovačů.
transform_keys(výraz, func) Transformuje klíče v mapě expr pomocí funkce func.
transform_values(výraz, func) Transformuje hodnoty v mapě expr pomocí funkce func.
try_element_at(mapExpr, klíč) Vrátí hodnotu mapExpr pro hodnotu , keynebo NULL pokud key neexistuje.

Funkce data, časového razítka a intervalu

Informace o formátech data a časového razítka najdete v tématu Vzory data a času.

Function Popis
intervalExpr / dělitel Vrátí interval dělený .divisor
– intervalExpr Vrátí negovanou hodnotu intervalExpr.
intervalExpr1 – intervalExpr2 Vrátí odčítání intervalExpr2 od intervalExpr1.
datetimeExpr1 – datetimeExpr2 Vrátí odčítání datetimeExpr2 od datetimeExpr1.
+ intervalExpr Vrátí hodnotu intervalExpr.
intervalExpr1 + intervalExpr2 Vrátí součet a intervalExpr1 intervalExpr2.
intervalExpr * multiplikand Vrátí intervalExpr hodnotu vynásobenou multiplicand.
abs(výraz) Vrátí absolutní hodnotu hodnoty intervalu v expr.
add_months(startDate;numMonths) Vrátí datum, které následuje numMonths startDate.
curdate() Vrátí aktuální datum na začátku vyhodnocení dotazu.
current_date() Vrátí aktuální datum na začátku vyhodnocení dotazu.
current_timestamp() Vrátí aktuální časové razítko na začátku vyhodnocení dotazu.
current_timezone() Vrátí aktuální místní časové pásmo relace.
date(výraz) Přetypuje hodnotu expr na DATE.
date_add(startDate;numDays) Vrátí datum numDays po startDate.
date_add(jednotka, hodnota, výraz) Přidá value units do časového razítka expr.
date_diff(jednotka, spuštění, zastavení) Vrátí rozdíl mezi dvěma časovými razítky měřenými ve units.
date_format(výraz,fmt) Převede časové razítko na řetězec ve formátu fmt.
date_from_unix_date(dny) Vytvoří datum z počtu dnů od 1970-01-01.
date_part(pole,výraz) Extrahuje část data, časového razítka nebo intervalu.
date_sub(startDate;numDays) Vrátí datum numDays před startDate.
date_trunc(jednotka,výraz) Vrátí zkrácené časové razítko na jednotku zadanou v unit.
dateadd(startDate;numDays) Vrátí datum numDays po startDate.
dateadd(jednotka, hodnota, výraz) Přidá value units do časového razítka expr.
datediff(endDate,startDate) Vrátí počet dnů od startDate do endDate.
datediff(jednotka, start, stop) Vrátí rozdíl mezi dvěma časovými razítky měřenými ve units.
day(výraz) Vrátí den v měsíci data nebo časového razítka.
dayofmonth(výraz) Vrátí den v měsíci data nebo časového razítka.
dayofweek(výraz) Vrátí den v týdnu data nebo časového razítka.
dayofyear(výraz) Vrátí den roku data nebo časového razítka.
dělitel div dividenda Vrátí celočíselnou část dělení intervalu divisor podle intervalu dividend.
extract(field FROM source) Vrátí field hodnotu source.
from_unixtime(unixTime,fmt) Vrátí unixTime v fmt.
from_utc_timestamp(výraz,časové pásmo) Vrátí časové razítko zadané v expr UTC v časovém pásmu timeZone.
getdate() Vrátí aktuální časové razítko na začátku vyhodnocení dotazu.
hour(výraz) Vrátí hodinovou komponentu časového razítka.
last_day(výraz) Vrátí poslední den v měsíci, do kterého datum patří.
make_date(rok;měsíc;den) Vytvoří datum z year, montha day pole.
make_dt_interval([dny[; hodiny[; mins[; sekundy]]]] ) Vytvoří denní interval z days, hoursmins a secs.
make_interval(roky, měsíce, týdny, dny, hodiny, miny, sekundy) Zastaralé: Vytvoří interval z , , , , , mins hoursa secs. daysweeksmonthsyears
make_timestamp(rok,měsíc,den,hodina,min;s[;časové pásmo]) Vytvoří časové razítko z yearpole , monthdayminhour, sec, a timezone pole.
make_ym_interval([roky[; měsíce]]) Vytvoří interval rok-měsíc z yearsa months.
minute(výraz) Vrátí minutovou součást časového razítka v expr.
month(výraz) Vrátí část měsíce časového razítka v expr.
months_between(výraz1,výraz2[;roundOff]) Vrátí počet měsíců uplynulých mezi kalendářními daty nebo časovými razítky v expr1 a expr2.
next_day(výraz,dayOfWeek) Vrátí první datum, které je pozdější než expr a pojmenované jako v dayOfWeek.
now() Vrátí aktuální časové razítko na začátku vyhodnocení dotazu.
quarter(výraz) Vrátí čtvrtletí roku pro expr rozsah 1 až 4.
second(výraz) Vrátí druhou komponentu časového razítka v expr.
session_window(výraz, gpDuration) Vytvoří okno relace nad výrazem časového razítka.
sign(výraz) Vrátí hodnotu -1,0, 0,0 nebo 1,0, protože interval expr je záporný, 0 nebo kladný.
signum(výraz) Vrátí hodnotu -1,0, 0,0 nebo 1,0, protože interval expr je záporný, 0 nebo kladný.
timediff(jednotka, spuštění, zastavení) Vrátí rozdíl mezi dvěma časovými razítky měřenými ve units.
timestamp(výraz) Přetypuje expr na TIMESTAMP.
timestamp_micros(výraz) Vytvoří časové razítko expr mikrosekund od epochy UTC.
timestamp_millis(výraz) Vytvoří časové razítko expr milisekund od epochy UTC.
timestamp_seconds(výraz) Vytvoří časové razítko expr sekund od epochy UTC.
timestampadd(jednotka, hodnota, výraz) Přidá value units do časového razítka expr.
timestampdiff(unit, start, stop) Vrátí rozdíl mezi dvěma časovými razítky měřenými ve units.
to_date(výraz[;fmt]) Vrátí expr přetypování na datum pomocí volitelného formátování.
to_timestamp(výraz[;fmt]) Vrátí expr přetypování na časové razítko pomocí volitelného formátování.
to_unix_timestamp(výraz[;fmt]) Vrátí časové razítko jako expr časové razítko systému UNIX.
to_utc_timestamp(výraz,časové pásmo) Vrátí časové razítko v expr jiném časovém pásmu jako UTC.
trunc(výraz, fmt) Vrátí datum s částí data zkrácenou na jednotku určenou formátovým modelem fmt.
try_add(výraz1, výraz2) Vrátí součet expr1 a expr2hodnotu NULL v případě chyby.
try_divide(dividenda, dělitel) Vrátí dividend hodnotu dělenou hodnotou divisor, nebo NULL, pokud divisor je 0.
try_multiply(násobitel, násobitel) Vrátí multiplier hodnotu vynásobenou násobením multiplicandnebo NULL při přetečení.
try_subtract(výraz1, výraz2) Vrátí odčítání expr2 od expr1, nebo NULL při přetečení.
try_to_timestamp(výraz[;fmt]) Vrátí expr přetypování na časové razítko pomocí volitelného formátování nebo NULL pokud se přetypování nezdaří.
unix_date(výraz) Vrátí počet dnů od 1970-01-01.
unix_micros(výraz) Vrátí počet mikrosekund od 1970-01-01 00:00:00 UTC.
unix_millis(výraz) Vrátí počet milisekund od 1970-01-01 00:00:00 UTC.
unix_seconds(výraz) Vrátí počet sekund od 1970-01-01 00:00:00 UTC.
unix_timestamp([výraz[; fmt]]) eturns the UNIX timestamp of current or specified time.
weekday(výraz) Vrátí den v týdnu .expr
weekofyear(výraz) Vrátí týden v roce expr.
year(výraz) Vrátí složku exprroku .
window(výraz, width[, step[; start]]) Vytvoří posuvné okno založené na skákání nad výrazem časového razítka.
window_time(okno) Vrátí inkluzivní koncový čas posuvného okna vytvořeného funkcemi okna nebo session_window .

Geoprostorové funkce H3

Informace o geoprostorových funkcích H3 najdete v tématu Geoprostorové funkce H3.

Přetypování funkcí a konstruktorů

Informace o přetypování mezi typy naleznete v tématu přetypování a try_cast funkce.

Function Popis
array([výraz [; ...]]) Vrátí matici s prvky v .expr
bigint(výraz) Přetypuje hodnotu expr na BIGINThodnotu .
binary(výraz) Přetypuje hodnotu expr na BINARYhodnotu .
boolean(výraz) Přetypuje expr na BOOLEAN.
cast(typ AS výrazu) Přetypuje hodnotu expr na cílový datový typ type.
výraz :: type Přetypuje hodnotu expr na cílový datový typ type.
date(výraz) Přetypuje hodnotu expr na DATEhodnotu .
decimal(výraz) Přetypuje hodnotu expr na DECIMALhodnotu .
double(výraz) Přetypuje hodnotu expr na DOUBLEhodnotu .
float(výraz) Přetypuje hodnotu expr na FLOAThodnotu .
int(výraz) Přetypuje hodnotu expr na INTEGERhodnotu .
make_date(rok;měsíc;den) Vytvoří datum z year, montha day pole.
make_dt_interval([dny[; hodiny[; mins[; sekundy]]]] ) Vytvoří denní interval z days, hoursmins a secs.
make_interval(roky, měsíce, týdny, dny, hodiny, miny, sekundy) Vytvoří interval z years, , monthsweeks, days, hoursmins a secs.
make_timestamp(rok,měsíc,den,hodina,min;s[;časové pásmo]) Vytvoří časové razítko z yearpole , monthdayminhour, sec, a timezone pole.
make_ym_interval([roky[; měsíce]]) Vytvoří interval rok-měsíc z yearsa months.
map([{klíč1; hodnota1} [; ...]]) Vytvoří mapu se zadanými páry klíč-hodnota.
named_struct({name1; val1} [; ...]) Vytvoří strukturu se zadanými názvy polí a hodnotami.
smallint(výraz) Přetypuje hodnotu expr na SMALLINThodnotu .
string(výraz) Přetypuje hodnotu expr na STRINGhodnotu .
struct(expr1 [; ...]) Vytvoří hodnotu STRUCT se zadanými hodnotami polí.
tinyint(výraz) Přetypuje expr na TINYINT.
timestamp(výraz) Přetypuje expr na TIMESTAMP.
to_char(výraz, fmt) Vrátí expr přetypování na STRING použití formátování fmt."
to_date(výraz[;fmt]) Vrátí expr přetypování na datum pomocí volitelného formátování.
to_number(výraz, fmt) Vrátí expr přetypování na DECIMAL pomocí formátování fmt.
to_timestamp(výraz[;fmt]) Vrátí expr přetypování na časové razítko pomocí volitelného formátování.
to_varchar(výraz, fmt) Vrátí expr přetypování na STRING použití formátování fmt."
try_cast(typ výraz AS) Přetypuje hodnotu expr na cílový datový typ type bezpečně.
try_to_number(výraz, fmt) Vrátí expr přetypování na DECIMAL použití formátování fmtnebo NULL pokud expr není platné.

Funkce CSV a Avro

Function Popis
from_avro(avroBin, jsonSchema[; options]) Vrátí hodnotu struktury založenou na avroBin hodnotě a jsonSchema.
from_csv(csvStr, schema[; options]) Vrátí hodnotu struktury s hodnotou csvStr a schema.
schema_of_csv(csv[, možnosti]) Vrátí schéma řetězce CSV ve formátu DDL.
to_avro(výraz[, možnosti]) Vrátí binární hodnotu Avro se zadanou hodnotou struktury.
to_csv(výraz[, možnosti]) Vrátí řetězec CSV se zadanou hodnotou struktury.

Funkce JSON

Function Popis
jsonStr : jsonPath Vrátí pole extrahovaná z objektu jsonStr.
from_json(jsonStr, schema[; options]) Vrátí hodnotu struktury s hodnotou jsonStr a schema.
get_json_object(výraz, cesta) Extrahuje objekt z pathobjektu JSON .
json_array_length(jsonArray) Vrátí počet prvků v nejkrajnější JSON matici.
json_object_keys(jsonObject) Vrátí všechny klíče vnějšího JSON objektu jako pole.
json_tuple(jsonStr, path1 [; ...]) Vrátí více JSON objektů jako řazenou kolekci členů.
parse_json(jsonStr) VARIANT Vrátí hodnotu z objektu jsonStr.
schema_of_json(jsonStr[; options]) Vrátí schéma JSON řetězce ve formátu DDL.
schema_of_json_agg(jsonStr[; options]) Vrátí kombinované schéma JSON řetězců ve skupině ve formátu DDL.
to_json(výraz[, možnosti]) Vrátí řetězec JSON s řetězcem nebo VARIANT zadaným STRUCT v expr.

Funkce VARIANT

Function Popis
variantExpr: jsonPath Vrátí pole extrahovaná z variantExpr cesty JSON.
is_variant_null(variantExpr) Testuje, zda variantExpr je VARIANT-kódován NULL.
parse_json(jsonStr) VARIANT Vrátí hodnotu z objektu jsonStr.
schema_of_variant(variantExpr) Vrátí schéma výrazu VARIANT ve formátu DDL.
schema_of_variant_agg(variantExpr) Vrátí kombinované schéma všech VARIANT hodnot ve skupině ve formátu DDL.
to_json(výraz[, možnosti]) Vrátí řetězec JSON s řetězcem nebo VARIANT zadaným STRUCT v expr.
try_parse_json(jsonStr) VARIANT Pokud je to možné, vrátí hodnotu.jsonStr Pokud není to možné, NULL vrátí se.
try_variant_get(variantExpr;path;type) Extrahuje hodnotu typu ze variantExprzadaného type pathtypu nebo NULL pokud není možné přetypovat na cílový typ.
variant_explode(variantExpr) Vrátí sadu řádků zrušením vnoření variantExpr.
variant_explode_outer(variantExpr) Vrátí sadu řádků zrušením vnořením variantExpr pomocí vnější sémantiky.
variant_get(variantExpr,path;type) Extrahuje hodnotu typu ze variantExprzadaného type parametrem path.

Funkce XPath a XML

Function Popis
from_xml(xmlStr, schema[; options]) Vrátí hodnotu struktury parsovanou z xmlStr metody using schema.
schema_of_xml(xmlStr[; options]) Vrátí schéma XML řetězce ve formátu DDL.
xpath(xml, xpath) Vrátí hodnoty v uzlech xml , které odpovídají xpath.
xpath_boolean(xml, xpath) Vrátí true , pokud se xpath výraz vyhodnotí jako truenebo pokud je nalezen odpovídající uzel xml .
xpath_double(xml, xpath) DOUBLE Vrátí hodnotu z dokumentu XML.
xpath_float(xml, xpath) FLOAT Vrátí hodnotu z dokumentu XML.
xpath_int(xml, xpath) INTEGER Vrátí hodnotu z dokumentu XML.
xpath_long(xml, xpath) BIGINT Vrátí hodnotu z dokumentu XML.
xpath_number(xml, xpath) DOUBLE Vrátí hodnotu z dokumentu XML.
xpath_short(xml, xpath) SHORT Vrátí hodnotu z dokumentu XML.
xpath_string(xml, xpath) Vrátí obsah prvního uzlu XML, který odpovídá výrazu XPath.

Funkce AI

Function Popis
ai_analyze_sentiment(obsah) Vrátí mínění textu.
ai_classify(obsah, popisky) Klasifikuje zadaný obsah do jednoho z poskytnutých popisků.
ai_extract(obsah, popisky) Extrahuje entity určené popisky z daného textu.
ai_fix_grammar(obsah) Opraví gramatické chyby v daném textu.
ai_forecast(pozorované, time_col) Extropoluje data časových řad do budoucnosti.
ai_gen(obsah) Vyvolá nejmodernější generační model AI z rozhraní API modelu Foundation Databricks a odpoví na výzvu poskytovanou uživatelem.
ai_generate_text(prompt; modelName[; param1; value1] [...]) Zastaralé: Vrátí text vygenerovaný vybraným velkým jazykovým modelem (LLM) s výzvou.
ai_mask(obsah, popisky) Maskuje zadané entity v daném textu.
ai_query(endpointName, request, returnType) Vyvolá existující koncový bod obsluhy modelu Mosaic AI a parsuje a vrátí její odpověď.
ai_similarity(strExpr1, strExpr2) Porovná dva řetězce a vypočítá sémantické skóre podobnosti.
ai_summarize(obsah[; max_words]) Vygeneruje souhrn daného textu.
ai_translate(obsah, to_lang) Přeloží text do zadaného cílového jazyka.
vector_search(index, dotaz, num_results) Dotazování indexu Služby vektorového vyhledávání v systému Mosaic pomocí JAZYKa SQL

Funkce pro čtení

Function Popis
read_files(cesta; [optionKey => optionValue] [; ...]) Čte datové soubory v cloudovém úložišti a vrací je v tabulkovém formátu.
read_kafka([optionKey => optionValue] [; ...]) Čte záznamy z clusteru Apache Kafka a vrací je v tabulkovém formátu.
read_kinesis({parameter => value} [; ...]) Vrátí tabulku se záznamy načtenými z Kinesis z jednoho nebo více datových proudů.
read_pubsub([parametr => hodnota] [; ...]) Funkce s hodnotou tabulky pro čtení záznamů z pub/Sub z tématu.
read_pulsar({optionKey => optionValue} [; ...]) Vrátí tabulku se záznamy načtenými z Pulsaru.
read_state_metadata(cesta) Vrátí tabulku s řádky, které představují metadata stavu dotazu streamování.
read_statestore(cesta [; option_key => option_value] [...]) Vrátí záznamy z úložiště stavů streamovaných dotazů.

Různé funkce

Function Popis
assert_true(výraz) Vrátí chybu, pokud expr není pravdivá.
CASE expr { WHEN opt1 THEN res1 } [...] [ELSE def] KONEC Vrátí resN hodnotu pro prvníoptN, která se rovná nebo def pokud se žádná shoda neshodujeexpr.
CASE { WHEN cond1 THEN res1 } [...] [ELSE def] KONEC Vrátí resN hodnotu pro první condN , která se vyhodnotí jako true, nebo def pokud se žádná nenašla.
cloud_files_state( { TABLE(table) | checkpoint } ) Vrátí stav na úrovni souboru zdroje automatického zavaděče cloud_files .
coalesce(výraz1; výraz2 [; ...]) Vrátí první argument, který není null.
cube (výraz1 [, ...]) Vytvoří multidimenzionální datovou krychli pomocí zadaných sloupců výrazů.
current_catalog() Vrátí aktuální katalog.
current_database() Vrátí aktuální schéma.
current_metastore() Vrátí aktuální ID metastoru katalogu Unity.
current_recipient(klíč) Vrátí vlastnost aktuálního příjemce v zobrazení sdíleném se sdílením Delta.
current_schema() Vrátí aktuální schéma.
current_user() Vrátí uživatele, který příkaz spouští.
current_version() Vrátí aktuální verzi Azure Databricks.
decode(expr; { key, value } [; ...] [,defValue]) Vrátí hodnotu odpovídající klíči.
elt(index; výraz1 [; ...] ) Vrátí nth výraz.
equal_null(výraz1, výraz2) Vrátí true , pokud expr1 jsou stejné expr2 nebo oba výrazy jsou NULL, nebo false jinak.
event_log( { TABLE(table) | pipeline_id } ) Vrátí tabulku historie aktualizace pro materializované zobrazení, streamovanou tabulku nebo kanál DLT.
greatest(výraz1; výraz2 [; ...]) Vrátí největší hodnotu všech argumentů a přeskočí hodnoty null.
seskupení (sloupec) Určuje, zda zadaný sloupec v objektu GROUPING SET, ROLLUPnebo CUBE představuje mezisoučty.
grouping_id([sloupec1 [; ...]]) Vrátí úroveň seskupení pro sadu sloupců.
hash(výraz1 [; ...]) Vrátí hodnotu hash argumentů.
hll_sketch_estimate(výraz) Odhaduje počet jedinečných hodnot shromážděných ve skici HyperLogLogu.
hll_union(výraz1, výraz2 [;allowDifferentLgConfigK]) Kombinuje dva náčrty HyperLogLogu.
java_method(třída, metoda[; arg1 [; ...]]) Volá metodu s reflexí.
if(cond, výraz1, výraz2) Vrátí expr1 hodnotu, pokud cond je true, nebo expr2 jinak.
iff(cond, výraz1, výraz2) Vrátí expr1 hodnotu, pokud cond je true, nebo expr2 jinak.
ifnull(výraz1, výraz2) Vrátí expr2 hodnotu, pokud expr1 je NULL, nebo expr1 jinak.
input_file_block_length() Vrátí délku v bajtech bloku, který se čte.
input_file_block_start() Vrátí počáteční posun v bajtech bloku, který se čte.
input_file_name() Vrátí název souboru, který se čte, nebo prázdný řetězec, pokud není k dispozici.
is_account_group_member(skupina) Vrátí hodnotu true, pokud je aktuální uživatel členem skupiny na úrovni účtu.
is_member(skupina) Vrátí hodnotu true, pokud je aktuální uživatel členem skupiny na úrovni pracovního prostoru.
isnull(výraz) Vrátí true , pokud expr je NULL.
isnotnull(výraz) Vrátí true , pokud expr není NULL.
least(výraz1; výraz2 [; ...]) Vrátí nejmenší hodnotu všech argumentů a přeskočí hodnoty null.
list_secrets([scopeStr]) Vrátí klíče ve všech nebo jednom oboru, ve kterém má uživatel oprávnění k zobrazení z tajné služby Databricks.
luhn_check(numStr) Vrátí true hodnotu, pokud numStr projde kontrolou algoritmu Luhn.
monotonically_increasing_id() Vrátí monotonicky rostoucí 64bitová celá čísla.
nullif(výraz1, výraz2) Vrátí NULL hodnotu, pokud expr1 se rovná expr2, nebo expr1 jinak.
nvl(výraz1, výraz2) Vrátí expr2 hodnotu, pokud expr1 je NULL, nebo expr1 jinak.
nvl2(výraz1, výraz2, výraz3) Vrátí expr2 hodnotu, pokud expr1 není NULL, nebo expr3 jinak.
raise_error(výraz) Vyvolá výjimku se expr zprávou.
range(end) Vrátí tabulku hodnot v zadaném rozsahu.
range(začátek, konec [; krok [; numParts]]) Vrátí tabulku hodnot v zadaném rozsahu.
reflect(třída, metoda[, arg1 [; ...]]) Volá metodu s reflexí.
secret(scope, key) Extrahuje hodnotu tajného kódu s danou scope a key z tajné služby Databricks.
session_user() Vrátí uživatele připojeného k Azure Databricks.
spark_partition_id() Vrátí aktuální ID oddílu.
sql_keywords() Vrátí sadu klíčových slov SQL v Azure Databricks.
stack(numRows, výraz1 [; ...]) expr1Odděluje , ..., exprN do numRows řádků.
table_changes(table_str; začátek [; konec]) Vrátí protokol změn v tabulce Delta Lake s povoleným datovým kanálem změn.
try_reflect(třída, metoda[; arg1 [; ...]]) Volá metodu s reflexí, která NULL vrací, pokud metoda selže.
try_secret(rozsah, klíč) Extrahuje hodnotu tajného kódu s danou scope službou a key z tajné služby Databricks nebo NULL pokud klíč nelze načíst.
typeof(výraz) Vrátí řetězec typu ve formátu DDL pro datový typ expr.
user() Vrátí uživatele, který příkaz spouští.
uuid() Vrátí řetězec univerzálního jedinečného identifikátoru (UUID).
window(výraz, width[; step [; start]]) Vytvoří posuvné okno založené na skákání nad výrazem časového razítka.
xxhash64(výraz1 [, ...]) Vrátí 64bitovou hodnotu hash argumentů.
version() Vrátí verzi Apache Sparku.