Функция hll_sketch_estimate

Область применения: флажок Databricks SQL флажок Databricks Runtime 13.3 LTS и выше

Эта функция использует алгоритм HyperLog для подсчета вероятностного приближения числа уникальных значений в заданном столбце, потребляя двоичное представление, известное как буфер эскиза, созданное ранее функцией hll_sketch_agg и возвращая результат в виде большого целого числа.

Функции hll_union и hll_union_agg также могут объединять эскизы, используя и объединяя эти буферы в качестве входных данных.

Реализация использует библиотеку Apache Datasketches. Дополнительные сведения см. в HLL.

Синтаксис

hll_sketch_estimate ( expr )

Аргументы

  • exprBINARY: выражение с эскизом, созданным hll_sketch_agg.

Возвраты

Значение BIGINT , которое представляет собой приблизительное количество уникальных данных, представленных входным эскизом.

Примеры

> SELECT hll_sketch_estimate(hll_sketch_agg(col, 12))
    FROM VALUES (1), (1), (2), (2), (3) tab(col);
  3

> SELECT hll_sketch_estimate(hll_sketch_agg(col))
    FROM VALUES (1), (1), (2), (2), (3) tab(col);
  3