sys.dm_db_stats_histogram (Transact-SQL)

Se aplica a: SQL Server 2016 (13.x) y versiones posteriores Base de datos de Azure SQL Azure SQL Managed Instance

Devuelve el histograma de estadísticas para el objeto de base de datos especificado (tabla o vista indexada) en la base de datos de SQL Server actual. Similar a DBCC SHOW_STATISTICS WITH HISTOGRAM.

Nota:

Esta DMF está disponible a partir de SQL Server 2016 (13.x) SP1 CU2.

Sintaxis

sys.dm_db_stats_histogram (object_id, stats_id)  

Argumentos

object_id
Es el identificador del objeto en la base de datos actual para el que se han solicitado propiedades de una de sus estadísticas. object_id es int.

stats_id
Es el identificador de estadísticas para el object_idespecificado. El identificador de estadísticas se puede obtener desde la vista de administración dinámica sys.stats . stats_id es int.

Tabla devuelta

Nombre de la columna Tipo de datos Descripción
object_id int Identificador del objeto (tabla o vista indizada) para el que se devuelven las propiedades del objeto de estadísticas.
stats_id int Identificador del objeto de estadísticas. Es único dentro de la vista indizada o la tabla. Para obtener más información, vea sys.stats (Transact-SQL).
step_number int Número del paso en el histograma.
range_high_key sql_variant Valor de columna límite superior de un paso del histograma. El valor de columna también se denomina valor de clave.
range_rows real Número calculado de filas cuyo valor de columna está comprendido en un paso del histograma, sin incluir el límite superior.
equal_rows real Número calculado de filas cuyo valor de columna es igual al límite superior del paso del histograma.
distinct_range_rows bigint Número calculado de filas que tienen un valor de columna distinto en un paso del histograma, sin incluir el límite superior.
average_range_rows real Promedio de filas con valores de columna duplicados en un paso del histograma, sin incluir el límite superior (RANGE_ROWS / DISTINCT_RANGE_ROWS para DISTINCT_RANGE_ROWS > 0).

Comentarios

El conjunto de resultados para sys.dm_db_stats_histogram devuelve información similar a DBCC SHOW_STATISTICS WITH HISTOGRAM y también incluye object_id, stats_id y step_number.

Dado que la columna range_high_key es un tipo de datos sql_variant, es posible que tenga que usar CAST o CONVERT si un predicado realiza la comparación con una constante que no es de cadena.

Histograma

Un histograma mide la frecuencia de aparición de cada valor distinto en un conjunto de datos. El optimizador de consultas calcula un histograma de los valores de la primera columna de clave del objeto de estadísticas; para ello, selecciona los valores de la columna tomando una muestra estadística de las filas o realizando un análisis completo de todas las filas de la tabla o vista. Si el histograma se crea a partir de muestras de un conjunto de filas, los totales almacenados para el número de filas y el número de valores distintos son las estimaciones y no es necesario que sean números enteros.

Para crear el histograma, el optimizador de consultas ordena los valores de columna, calcula el número de valores que coinciden con cada valor de columna distinto y, a continuación, agrupa los valores de columna en un máximo de 200 pasos de histograma contiguos. Cada paso incluye un intervalo de valores de columna seguido de un valor de columna de límite superior. El intervalo incluye todos los valores de columna posibles comprendidos entre los valores límite (sin incluir los propios valores límite). El valor de columna ordenado más pequeño es el valor del límite superior del primer paso del histograma.

En el diagrama siguiente se muestra un histograma con seis pasos. El área a la izquierda del primer valor límite superior es el primer paso.

Imagen de cómo se calcula un histograma a partir de valores de columna de muestra.

En cada paso del histograma:

  • La línea gruesa representa el valor de límite superior (range_high_key) y el número de veces que tiene lugar (equal_rows).

  • El área de color sólido situada a la izquierda de range_high_key representa el rango de valores de columna y el número medio de veces que tiene lugar cada valor de columna (average_range_rows). El valor de average_range_rows en el primer paso del histograma siempre es 0.

  • Las líneas de puntos representan los valores de las muestras utilizados para estimar el número total de valores distintos que hay en el rango (distinct_range_rows) y el número total de valores que hay en el rango (range_rows). El optimizador de consultas utiliza range_rows y distinct_range_rows para calcular average_range_rows y no almacena los valores de las muestras.

El optimizador de consultas define los pasos del histograma en función de su importancia estadística. Utiliza un algoritmo de diferencias máximas para minimizar el número de pasos del histograma a la vez que minimiza las diferencias entre los valores límite. El número máximo de pasos es 200. El número de pasos del histograma puede ser menor que el número de valores distintos, incluso para las columnas con menos de 200 puntos de límite. Por ejemplo, una columna con 100 valores distintos puede tener un histograma con menos de 100 puntos de límite.

Permisos

Necesita que el usuario tenga permisos de selección en columnas de estadísticas o posea la tabla, o que el usuario sea miembro del rol fijo de servidor sysadmin, del rol fijo de base de datos db_owner o del rol fijo de base de datos db_ddladmin.

Ejemplos

A. Ejemplo sencillo

En el ejemplo siguiente se crea y rellena una tabla sencilla. A continuación, crea estadísticas en la columna Country_Name.

CREATE TABLE Country
(Country_ID int IDENTITY PRIMARY KEY,
Country_Name varchar(120) NOT NULL);
INSERT Country (Country_Name) VALUES ('Canada'), ('Denmark'), ('Iceland'), ('Peru');

CREATE STATISTICS Country_Stats  
    ON Country (Country_Name) ;  

La clave principal ocupa el stat_id número 1, por lo que llame a sys.dm_db_stats_histogram para el stat_id número 2 para devolver el histograma de estadísticas de la tabla Country.

SELECT * FROM sys.dm_db_stats_histogram(OBJECT_ID('Country'), 2);

B. Consulta útil:

SELECT hist.step_number, hist.range_high_key, hist.range_rows, 
    hist.equal_rows, hist.distinct_range_rows, hist.average_range_rows
FROM sys.stats AS s
CROSS APPLY sys.dm_db_stats_histogram(s.[object_id], s.stats_id) AS hist
WHERE s.[name] = N'<statistic_name>';

C. Consulta útil:

En el ejemplo siguiente se selecciona de la tabla Country con un predicado en la columna Country_Name.

SELECT * FROM Country 
WHERE Country_Name = 'Canada';

En el ejemplo siguiente se examina la estadística creada anteriormente en la tabla Country y la columna Country_Name para el paso de histograma que coincide con el predicado de la consulta anterior.

SELECT ss.name, ss.stats_id, shr.steps, shr.rows, shr.rows_sampled, 
    shr.modification_counter, shr.last_updated, sh.range_rows, sh.equal_rows
FROM sys.stats ss
INNER JOIN sys.stats_columns sc 
    ON ss.stats_id = sc.stats_id AND ss.object_id = sc.object_id
INNER JOIN sys.all_columns ac 
    ON ac.column_id = sc.column_id AND ac.object_id = sc.object_id
CROSS APPLY sys.dm_db_stats_properties(ss.object_id, ss.stats_id) shr
CROSS APPLY sys.dm_db_stats_histogram(ss.object_id, ss.stats_id) sh
WHERE ss.[object_id] = OBJECT_ID('Country') 
    AND ac.name = 'Country_Name'
    AND sh.range_high_key = CAST('Canada' AS CHAR(8));

Pasos siguientes

DBCC SHOW_STATISTICS (Transact-SQL)
Funciones y vistas de administración dinámica relacionadas con objetos (Transact-SQL)
sys.dm_db_stats_properties (Transact-SQL)