bitmap_construct_agg
集計関数
適用対象: Databricks SQL Databricks Runtime 13.3 LTS 以降
グループ内のすべてのビット位置の値に対するビット演算 (OR
) を返します。 グループ内は 0 から 32767 の間の BINARY
です。
関数は、通常、bitmap_bucket_number() 関数、bitmap_count() 関数、bitmap_bit_position() 関数を組み合わせて、個別の整数の高密度なセットの数をカウントするために使われます。
整数数値の形式でビットマップを集計するには、bit_or() 集計関数を使います。
構文
bitmap_construct_agg(expr) [FILTER ( WHERE cond ) ]
この関数は、OVER
句を使用して ウィンドウ 関数として呼び出すこともできます。
引数
expr
:BINARY
文字列内でのビット位置を表す、0 から 32767 までの間の整数数値式。cond
: 集計に使用される行をフィルター処理するブール式 (省略可能)。
返品
長さ 4096 の BINARY
。
例
> SELECT hex(trim(TRAILING X'00' FROM bitmap_construct_agg(val))) FROM VALUES(0) AS T(val);
01
> SELECT hex(trim(TRAILING X'00' FROM bitmap_construct_agg(val))) FROM VALUES(15) AS T(val);
0080
> SELECT hex(trim(TRAILING X'00' FROM bitmap_construct_agg(val)))
FROM VALUES(1), (3), (7), (15), (31) AS T(val);
8A800080
-- Count the number of distinct values
> SELECT sum(num_distinct) AS num_distinct
FROM (SELECT bitmap_bucket_number(val),
bitmap_count(bitmap_construct_agg(bitmap_bit_position(val)))
FROM VALUES(1), (2), (1), (-1), (5), (0), (5) AS t(val)
GROUP BY ALL) AS distinct_vals_by_bucket(bucket, num_distinct)
5