Referencia de tabla del sistema de utilización facturable
En este artículo se proporciona información general sobre la tabla del sistema de uso facturable, incluidas las consultas de esquema y ejemplo. Con las tablas del sistema, los datos de uso facturables de la cuenta se centralizan y enrutan a todas las regiones, por lo que puede ver el uso global de la cuenta desde la región en la que se encuentre el área de trabajo.
Para obtener más información sobre cómo usar esta tabla para supervisar los costes de los trabajos, consulte Supervisión de los costes de trabajo con las tablas del sistema.
Para obtener estrategias sobre el análisis del uso sin servidor, vea Supervisión del costo de proceso sin servidor.
Ruta de acceso de tabla: esta tabla del sistema se encuentra en system.billing.usage
.
Esquema de la tabla de facturación
La tabla del sistema de uso facturable usa el esquema siguiente:
Nombre de la columna | Tipo de datos | Descripción | Ejemplo |
---|---|---|---|
record_id |
cadena | Id. único de este registro | 11e22ba4-87b9-4cc2 -9770-d10b894b7118 |
account_id |
cadena | Id. de la cuenta para la que se generó este informe | 23e22ba4-87b9-4cc2 -9770-d10b894b7118 |
workspace_id |
cadena | Id. del área de trabajo a la que se ha asociado este uso | 1234567890123456 |
sku_name |
cadena | Nombre de la SKU | STANDARD_ALL_PURPOSE_COMPUTE |
cloud |
cadena | Nube para la que este uso es relevante. Los valores posibles son AWS , AZURE y GCP . |
AWS , AZURE o GCP |
usage_start_time |
timestamp | Hora de inicio relevante para este registro de uso. La información de zona horaria se registra al final del valor con +00:00 , que representa la hora horaria UTC. |
2023-01-09 10:00:00.000+00:00 |
usage_end_time |
timestamp | Hora de finalización relevante para este registro de uso. La información de zona horaria se registra al final del valor con +00:00 , que representa la hora horaria UTC. |
2023-01-09 11:00:00.000+00:00 |
usage_date |
date | Fecha del registro de uso, este campo se puede usar para una agregación más rápida por fecha | 2023-01-01 |
custom_tags |
map | Etiquetas aplicadas a este uso. Incluye etiquetas de recursos de proceso, etiquetas de trabajos, etiquetas personalizadas del área de trabajo y etiquetas de directiva de presupuesto. | { “env”: “production” } |
usage_unit |
string | Unidad en la que se mide este uso. Entre los valores posibles se incluyen DBU. | DBU |
usage_quantity |
Decimal | Número de unidades consumidas para este registro. | 259.2958 |
usage_metadata |
struct | Metadatos proporcionados por el sistema sobre el uso, incluidos los id. para los recursos de proceso y los trabajos (si procede). Vea Analizar metadatos de uso. | {cluster_id: null; instance_pool_id: null; notebook_id: null; job_id: null; node_type: null} |
identity_metadata |
struct | Metadatos proporcionados por el sistema sobre las identidades implicadas en el uso. Vea Analizar metadatos de identidad. | {run_as: example@email.com} |
record_type |
string | Si el registro es original, una retracción o una segmentación. El valor es ORIGINAL a menos que el registro esté relacionado con una corrección. Vea Análisis de registros de corrección. |
ORIGINAL |
ingestion_date |
date | Fecha en la que se ingirió el registro en la tabla usage . |
2024-01-01 |
billing_origin_product |
string | Producto que originó el uso. Algunos productos se pueden facturar como SKU diferentes. Para conocer los valores posibles, consulte Ver información sobre el producto asociado al uso. | JOBS |
product_features |
struct | Detalles sobre las características específicas del producto usadas. | Para conocer los valores posibles, consulte Características del producto. |
usage_type |
string | Tipo de uso que se atribuye al producto o a la carga de trabajo con fines de facturación. Los valores posibles son COMPUTE_TIME , STORAGE_SPACE , NETWORK_BYTES , API_CALLS , TOKEN o GPU_TIME . |
STORAGE_SPACE |
Analizar metadatos de uso
Los valores en usage_metadata
le indican los recursos implicados en el registro de uso.
Valor | Tipo de datos | Descripción |
---|---|---|
cluster_id |
string | Identificador del clúster asociado al registro de uso |
warehouse_id |
string | Identificador de SQL Warehouse asociado al registro de uso |
instance_pool_id |
string | Identificador del grupo de instancias asociado al registro de uso |
node_type |
string | El tipo de instancia del recurso de proceso |
job_id |
string | Identificador del trabajo asociado al registro de uso. Solo devuelve un valor para el uso de procesos sin servidor o proceso de trabajos; de lo contrario, devuelve null . |
job_run_id |
string | Identificador de la ejecución del trabajo asociada al registro de uso. Solo devuelve un valor para el uso de procesos sin servidor o proceso de trabajos; de lo contrario, devuelve null . |
job_name |
string | Nombre otorgado por el usuario del trabajo asociado al registro de uso. Solo devuelve un valor para la ejecución de trabajos en procesos sin servidor; de lo contrario, devuelve null . |
notebook_id |
string | Identificador del cuaderno asociado al uso. Solo devuelve un valor para el proceso sin servidor para el uso de cuadernos; de lo contrario, devuelve null . |
notebook_path |
string | Ruta de acceso de almacenamiento del área de trabajo del cuaderno asociado al uso. Solo devuelve un valor para el proceso sin servidor para el uso de cuadernos; de lo contrario, devuelve null . |
dlt_pipeline_id |
string | Identificador de la canalización Delta Live Tables asociada al registro de uso |
dlt_update_id |
string | Actualización del identificador de la canalización Delta Live Tables asociada al registro de uso |
dlt_maintenance_id |
string | Tareas de mantenimiento del identificador de la canalización Delta Live Tables asociada al registro de uso |
run_name |
string | El identificador de usuario único de la ejecución de ajuste preciso del Entrenamiento del modelo de IA de Mosaico asociado al registro de uso |
endpoint_name |
string | Nombre del punto de conexión de servicio del modelo o punto de conexión del vector de búsqueda asociado al registro de uso |
endpoint_id |
string | Identificador del punto de conexión de servicio del modelo o punto de conexión del vector de búsqueda asociado al registro de uso |
central_clean_room_id |
string | Identificador de la sala de limpieza central asociada al registro de uso |
Analizar metadatos de identidad
La columna identity_metadata
puede ayudarle a identificar quién es responsable de un registro de facturación sin servidor. La columna incluye un valor run_as
que atribuye el uso a una identidad. La identidad registrada en identity_metadata.run_as
depende del producto asociado al uso.
Haga referencia a la tabla siguiente para el identity_metadata.run_as
comportamiento:
Tipo de carga de trabajo | Identidad de run_as |
---|---|
Proceso de trabajos | Usuario o entidad de servicio definida en la configuración de run_as . De forma predeterminada, los trabajos se ejecutan como la identidad del propietario del trabajo, pero los administradores pueden cambiarlo para que sea otro usuario o entidad de servicio. |
Proceso sin servidor para trabajos | Usuario o entidad de servicio definida en la configuración de run_as . De forma predeterminada, los trabajos se ejecutan como la identidad del propietario del trabajo, pero los administradores pueden cambiarlo para que sea otro usuario o entidad de servicio. |
Proceso sin servidor para cuadernos | El usuario que ejecutó los comandos del cuaderno (en concreto, el usuario que creó la sesión del cuaderno). En el caso de los cuadernos compartidos, esto incluye el uso de otros usuarios que comparten la misma sesión de cuaderno. |
Canalizaciones de Delta Live Tables | Usuario cuyos permisos se usan para ejecutar la canalización de Delta Live Tables. Esto se puede cambiar mediante la transferencia de la propiedad de la canalización. |
Entrenamiento del modelo de IA de mosaico | Usuario o entidad de servicio que inició la ejecución de entrenamiento de ajuste preciso. |
Análisis de registros de corrección
La tabla billing.usage
admite correcciones. Las correcciones se producen cuando cualquier campo del registro de uso es incorrecto y debe corregirse.
Cuando se produce una corrección, Azure Databricks agrega dos registros nuevos a la tabla. Un registro de retracción niega el registro incorrecto original y, a continuación, un registro de segmentación incluye la información corregida. Los registros de corrección se identifican mediante el campo record_type
:
RETRACTION
: se usa para negar el uso incorrecto original. Todos los campos son idénticos al registroORIGINAL
, exceptousage_quantity
, que es un valor negativo que cancela la cantidad de uso original. Por ejemplo, si la cantidad de uso del registro original era259.4356
, el registro de retracción tendría una cantidad de uso de-259.4356
.RESTATEMENT
: registro que incluye los campos correctos y la cantidad de uso.
Por ejemplo, la consulta siguiente devuelve la cantidad de uso por hora correcta relacionada con job_id
, incluso si se han realizado correcciones. Al agregar la cantidad de uso, el registro de retracción niega el registro original y solo se devuelven los valores de segmentación.
SELECT
usage_metadata.job_id, usage_start_time, usage_end_time,
SUM(usage_quantity) as usage_quantity
FROM system.billing.usage
GROUP BY ALL
HAVING usage_quantity != 0
Nota:
Para las correcciones en las que no se debe haber escrito el registro de uso original, una corrección solo puede agregar un registro de retracción y ningún registro de reposición.
Ver información sobre el producto asociado al uso
Algunos productos de Databricks se facturan con la misma SKU compartida. Para ayudarle a diferenciar el uso, las columnas billing_origin_product
y product_features
proporcionan más información sobre el producto y las características específicas asociadas al uso.
La columna billing_origin_product
muestra el producto de Databricks asociado al registro de uso. Los valores incluyen:
JOBS
DLT
SQL
ALL_PURPOSE
MODEL_SERVING
INTERACTIVE
MANAGED_STORAGE
VECTOR_SEARCH
LAKEHOUSE_MONITORING
PREDICTIVE_OPTIMIZATION
ONLINE_TABLES
FOUNDATION_MODEL_TRAINING
La columna product_features
es un objeto que contiene información sobre las características de producto específicas usadas e incluye los siguientes pares clave-valor:
jobs_tier
: los valores incluyenLIGHT
,CLASSIC
onull
sql_tier
: los valores incluyenCLASSIC
,PRO
onull
dlt_tier
: los valores incluyenCORE
,PRO
,ADVANCED
onull
is_serverless
: los valores incluyentrue
ofalse
, o biennull
is_photon
: los valores incluyentrue
ofalse
, o biennull
serving_type
: los valores incluyenMODEL
,GPU_MODEL
,FOUNDATION_MODEL
,FEATURE
onull
Consultas de ejemplo
Puede usar las siguientes consultas de ejemplo para responder a preguntas comunes sobre el uso facturable:
- ¿Cuál es la tendencia diaria del consumo de DBU?
- ¿Cuántas DTU de cada producto se han usado a lo largo de este mes?
- ¿Qué trabajos consumieron la mayoría de DBU?
- ¿Cuánto uso se puede atribuir a los recursos con una etiqueta determinada?
- Mostrarme las SKU en las que el uso está creciendo
- ¿Cuál es la tendencia de uso de Proceso de todos los propósitos (Photon)?
- ¿Cuál es el consumo de DBU de una vista materializada o una tabla de streaming?
- ¿Cuál es el consumo de DBU de una canalización DLT sin servidor?
¿Cuál es la tendencia diaria del consumo de DBU?
SELECT
usage_date as `Date`, sum(usage_quantity) as `DBUs Consumed`
FROM
system.billing.usage
WHERE
sku_name = "STANDARD_ALL_PURPOSE_COMPUTE"
GROUP BY
usage_date
ORDER BY
usage_date ASC
¿Cuántas DTU de cada producto se han usado a lo largo de este mes?
SELECT
billing_origin_product,
usage_date,
sum(usage_quantity) as usage_quantity
FROM system.billing.usage
WHERE
month(usage_date) = month(NOW())
AND year(usage_date) = year(NOW())
GROUP BY billing_origin_product, usage_date
¿Qué trabajos consumieron la mayoría de DBU?
SELECT
usage_metadata.job_id as `Job ID`, sum(usage_quantity) as `Usage`
FROM
system.billing.usage
WHERE
usage_metadata.job_id IS NOT NULL
GROUP BY
`Job ID`
ORDER BY
`DBUs` DESC
¿Cuánto uso se puede atribuir a los recursos con una etiqueta específica?
Puede desglosar los costos de varias maneras. En este ejemplo se muestra cómo desglosar los costos por una etiqueta personalizada. Asegúrese de reemplazar la clave y el valor de la etiqueta personalizada en la consulta.
SELECT
sku_name, usage_unit, SUM(usage_quantity) as `Usage`
FROM
system.billing.usage
WHERE
custom_tags.{{key}} = "{{value}}"
GROUP BY 1, 2
Mostrarme los productos en los que el uso está creciendo
SELECT
after.billing_origin_product, before_dbus, after_dbus, ((after_dbus - before_dbus)/before_dbus * 100) AS growth_rate
FROM
(SELECT
billing_origin_product, sum(usage_quantity) as before_dbus
FROM
system.billing.usage
WHERE
usage_date BETWEEN "2023-04-01" and "2023-04-30"
GROUP BY
billing_origin_product
) as before
JOIN
(SELECT
billing_origin_product, sum(usage_quantity) as after_dbus
FROM
system.billing.usage
WHERE
usage_date
BETWEEN
"2023-05-01" and "2023-05-30"
GROUP BY
billing_origin_product
) as after
WHERE
before.billing_origin_product = after.billing_origin_product
SORT BY
growth_rate DESC
¿Cuál es la tendencia de uso de Proceso de todos los propósitos (Photon)?
SELECT
sku_name,
usage_date,
sum(usage_quantity) as `DBUs consumed`
FROM
system.billing.usage
WHERE
year(usage_date) = year(CURRENT_DATE)
AND
sku_name = "ENTERPRISE_ALL_PURPOSE_COMPUTE_(PHOTON)"
AND
usage_date > "2023-04-15"
GROUP BY
sku_name, usage_date
¿Cuál es el consumo de DBU de una vista materializada o una tabla de streaming?
Para obtener el uso de DBU y la SKU para una vista materializada específica o una tabla de streaming, envía una consulta a la tabla del sistema de uso facturable para los registros donde usage_metadata.dlt_pipeline_id
se establece en el identificador de la canalización asociada a la vista materializada o la tabla de streaming. Puedes encontrar el identificador de canalización en la pestaña Detalles al ver la vista materializada pertinente o la tabla de streaming. Para limitar de manera opcional el consumo por fecha, especifica una fecha de inicio, una fecha de finalización o un intervalo de fechas. La consulta siguiente recupera el uso de DBU para la canalización con el identificador 00732f83-cd59-4c76-ac0d-57958532ab5b
y una fecha de inicio de uso de 2023-05-30
:
SELECT
sku_name,
usage_date,
SUM(usage_quantity) AS `DBUs`
FROM
system.billing.usage
WHERE
usage_metadata.dlt_pipeline_id = "00732f83-cd59-4c76-ac0d-57958532ab5b"
AND
usage_start_time > "2023-05-30"
GROUP BY
ALL
¿Cuál es el consumo de DBU de una canalización DLT sin servidor?
Para obtener el uso de DBU y la SKU de una canalización de DLT sin servidor, envía una consulta a la tabla del sistema de uso facturable para los registros donde usage_metadata.dlt_pipeline_id
se establece en el identificador de la canalización. Puedes encontrar el identificador de canalización en la pestaña Detalles de canalización al ver una canalización en la interfaz de usuario de Delta Live Tables. Para limitar de manera opcional el consumo por fecha, especifica una fecha de inicio, una fecha de finalización o un intervalo de fechas. La consulta siguiente recupera el uso de DBU de diciembre de 2023 para la canalización con el identificador 00732f83-cd59-4c76-ac0d-57958532ab5b
.
SELECT
sku_name,
usage_date,
SUM(usage_quantity) AS `DBUs`
FROM
system.billing.usage
WHERE
usage_metadata.dlt_pipeline_id = "00732f83-cd59-4c76-ac0d-57958532ab5b"
AND
usage_start_time >= "2023-12-01"
AND
usage_end_time < "2024-01-01"
GROUP BY
ALL