Funktionen validate_utf8
Gäller för: Databricks Runtime 15.4 och senare
Returnerar indatavärdet om det motsvarar en giltig UTF-8-sträng eller genererar INVALID_UTF8_STRING
något annat.
Syntax
validate_utf8(strExpr)
Argument
strExpr
: EttSTRING
uttryck.
Returer
En STRING
som är bytevis lika med strExpr
om den representerar en giltig UTF-8-sträng eller genererar INVALID_UTF8_STRING
något annat.
Om du vill returnera NULL
om indata inte är en giltig UTF-8-sträng använder du funktionen try_validate_utf8 .
Exempel
– Simple example taking a valid string as input.
> SELECT validate_utf8('Spark')
Spark
– Simple example taking a valid collated string as input.
> SELECT validate_utf8('SQL' COLLATE UTF8_LCASE)
SQL
– Simple example taking a valid hexadecimal string as input.
> SELECT validate_utf8(x'61')
a
– Example taking an invalid hexadecimal string as input (illegal UTF-8 byte sequence).
> SELECT validate_utf8(x'80')
[INVALID_UTF8_STRING] Invalid UTF8 byte sequence found in string: \x80.