Referencia de tabla del sistema de utilización facturable

En este artículo se proporciona información general sobre la tabla del sistema de uso facturable, incluidas las consultas de esquema y ejemplo. Con las tablas del sistema, los datos de uso facturables de la cuenta se centralizan y enrutan a todas las regiones, por lo que puede ver el uso global de la cuenta desde la región en la que se encuentre el área de trabajo.

Para obtener más información sobre cómo usar esta tabla para supervisar los costes de los trabajos, consulte Supervisión de los costes de trabajo con las tablas del sistema.

Para obtener estrategias sobre el análisis del uso sin servidor, vea Supervisión del costo de proceso sin servidor.

Ruta de acceso de tabla: esta tabla del sistema se encuentra en system.billing.usage.

Esquema de la tabla de facturación

La tabla del sistema de uso facturable usa el esquema siguiente:

Nombre de la columna Tipo de datos Descripción Ejemplo
record_id cadena Id. único de este registro 11e22ba4-87b9-4cc2
-9770-d10b894b7118
account_id cadena Id. de la cuenta para la que se generó este informe 23e22ba4-87b9-4cc2
-9770-d10b894b7118
workspace_id cadena Id. del área de trabajo a la que se ha asociado este uso 1234567890123456
sku_name cadena Nombre de la SKU STANDARD_ALL_PURPOSE_COMPUTE
cloud cadena Nube para la que este uso es relevante. Los valores posibles son AWS, AZURE y GCP. AWS, AZUREo GCP
usage_start_time timestamp Hora de inicio relevante para este registro de uso. La información de zona horaria se registra al final del valor con +00:00, que representa la hora horaria UTC. 2023-01-09 10:00:00.000+00:00
usage_end_time timestamp Hora de finalización relevante para este registro de uso. La información de zona horaria se registra al final del valor con +00:00, que representa la hora horaria UTC. 2023-01-09 11:00:00.000+00:00
usage_date date Fecha del registro de uso, este campo se puede usar para una agregación más rápida por fecha 2023-01-01
custom_tags map Etiquetas aplicadas a este uso. Incluye etiquetas de recursos de proceso, etiquetas de trabajos, etiquetas personalizadas del área de trabajo y etiquetas de directiva de presupuesto. { “env”: “production” }
usage_unit string Unidad en la que se mide este uso. Entre los valores posibles se incluyen DBU. DBU
usage_quantity Decimal Número de unidades consumidas para este registro. 259.2958
usage_metadata struct Metadatos proporcionados por el sistema sobre el uso, incluidos los id. para los recursos de proceso y los trabajos (si procede). Vea Analizar metadatos de uso. {cluster_id: null;
instance_pool_id: null;
notebook_id: null;
job_id: null;
node_type: null}
identity_metadata struct Metadatos proporcionados por el sistema sobre las identidades implicadas en el uso. Vea Analizar metadatos de identidad. {run_as: example@email.com}
record_type string Si el registro es original, una retracción o una segmentación. El valor es ORIGINAL a menos que el registro esté relacionado con una corrección. Vea Análisis de registros de corrección. ORIGINAL
ingestion_date date Fecha en la que se ingirió el registro en la tabla usage. 2024-01-01
billing_origin_product string Producto que originó el uso. Algunos productos se pueden facturar como SKU diferentes. Para conocer los valores posibles, consulte Ver información sobre el producto asociado al uso. JOBS
product_features struct Detalles sobre las características específicas del producto usadas. Para conocer los valores posibles, consulte Características del producto.
usage_type string Tipo de uso que se atribuye al producto o a la carga de trabajo con fines de facturación. Los valores posibles son COMPUTE_TIME, STORAGE_SPACE, NETWORK_BYTES, API_CALLS, TOKEN o GPU_TIME. STORAGE_SPACE

Analizar metadatos de uso

Los valores en usage_metadata le indican los recursos implicados en el registro de uso.

Valor Tipo de datos Descripción
cluster_id string Identificador del clúster asociado al registro de uso
warehouse_id string Identificador de SQL Warehouse asociado al registro de uso
instance_pool_id string Identificador del grupo de instancias asociado al registro de uso
node_type string El tipo de instancia del recurso de proceso
job_id string Identificador del trabajo asociado al registro de uso. Solo devuelve un valor para el uso de procesos sin servidor o proceso de trabajos; de lo contrario, devuelve null.
job_run_id string Identificador de la ejecución del trabajo asociada al registro de uso. Solo devuelve un valor para el uso de procesos sin servidor o proceso de trabajos; de lo contrario, devuelve null.
job_name string Nombre otorgado por el usuario del trabajo asociado al registro de uso. Solo devuelve un valor para la ejecución de trabajos en procesos sin servidor; de lo contrario, devuelve null.
notebook_id string Identificador del cuaderno asociado al uso. Solo devuelve un valor para el proceso sin servidor para el uso de cuadernos; de lo contrario, devuelve null.
notebook_path string Ruta de acceso de almacenamiento del área de trabajo del cuaderno asociado al uso. Solo devuelve un valor para el proceso sin servidor para el uso de cuadernos; de lo contrario, devuelve null.
dlt_pipeline_id string Identificador de la canalización Delta Live Tables asociada al registro de uso
dlt_update_id string Actualización del identificador de la canalización Delta Live Tables asociada al registro de uso
dlt_maintenance_id string Tareas de mantenimiento del identificador de la canalización Delta Live Tables asociada al registro de uso
run_name string El identificador de usuario único de la ejecución de ajuste preciso del Entrenamiento del modelo de IA de Mosaico asociado al registro de uso
endpoint_name string Nombre del punto de conexión de servicio del modelo o punto de conexión del vector de búsqueda asociado al registro de uso
endpoint_id string Identificador del punto de conexión de servicio del modelo o punto de conexión del vector de búsqueda asociado al registro de uso
central_clean_room_id string Identificador de la sala de limpieza central asociada al registro de uso

Analizar metadatos de identidad

La columna identity_metadata puede ayudarle a identificar quién es responsable de un registro de facturación sin servidor. La columna incluye un valor run_as que atribuye el uso a una identidad. La identidad registrada en identity_metadata.run_as depende del producto asociado al uso.

Haga referencia a la tabla siguiente para el identity_metadata.run_as comportamiento:

Tipo de carga de trabajo Identidad de run_as
Proceso de trabajos Usuario o entidad de servicio definida en la configuración de run_as. De forma predeterminada, los trabajos se ejecutan como la identidad del propietario del trabajo, pero los administradores pueden cambiarlo para que sea otro usuario o entidad de servicio.
Proceso sin servidor para trabajos Usuario o entidad de servicio definida en la configuración de run_as. De forma predeterminada, los trabajos se ejecutan como la identidad del propietario del trabajo, pero los administradores pueden cambiarlo para que sea otro usuario o entidad de servicio.
Proceso sin servidor para cuadernos El usuario que ejecutó los comandos del cuaderno (en concreto, el usuario que creó la sesión del cuaderno). En el caso de los cuadernos compartidos, esto incluye el uso de otros usuarios que comparten la misma sesión de cuaderno.
Canalizaciones de Delta Live Tables Usuario cuyos permisos se usan para ejecutar la canalización de Delta Live Tables. Esto se puede cambiar mediante la transferencia de la propiedad de la canalización.
Entrenamiento del modelo de IA de mosaico Usuario o entidad de servicio que inició la ejecución de entrenamiento de ajuste preciso.

Análisis de registros de corrección

La tabla billing.usage admite correcciones. Las correcciones se producen cuando cualquier campo del registro de uso es incorrecto y debe corregirse.

Cuando se produce una corrección, Azure Databricks agrega dos registros nuevos a la tabla. Un registro de retracción niega el registro incorrecto original y, a continuación, un registro de segmentación incluye la información corregida. Los registros de corrección se identifican mediante el campo record_type:

  • RETRACTION: se usa para negar el uso incorrecto original. Todos los campos son idénticos al registro ORIGINAL, excepto usage_quantity, que es un valor negativo que cancela la cantidad de uso original. Por ejemplo, si la cantidad de uso del registro original era 259.4356, el registro de retracción tendría una cantidad de uso de -259.4356.
  • RESTATEMENT: registro que incluye los campos correctos y la cantidad de uso.

Por ejemplo, la consulta siguiente devuelve la cantidad de uso por hora correcta relacionada con job_id, incluso si se han realizado correcciones. Al agregar la cantidad de uso, el registro de retracción niega el registro original y solo se devuelven los valores de segmentación.

SELECT
  usage_metadata.job_id, usage_start_time, usage_end_time,
  SUM(usage_quantity) as usage_quantity
FROM system.billing.usage
GROUP BY ALL
HAVING usage_quantity != 0

Nota:

Para las correcciones en las que no se debe haber escrito el registro de uso original, una corrección solo puede agregar un registro de retracción y ningún registro de reposición.

Ver información sobre el producto asociado al uso

Algunos productos de Databricks se facturan con la misma SKU compartida. Para ayudarle a diferenciar el uso, las columnas billing_origin_product y product_features proporcionan más información sobre el producto y las características específicas asociadas al uso.

La columna billing_origin_product muestra el producto de Databricks asociado al registro de uso. Los valores incluyen:

  • JOBS
  • DLT
  • SQL
  • ALL_PURPOSE
  • MODEL_SERVING
  • INTERACTIVE
  • MANAGED_STORAGE
  • VECTOR_SEARCH
  • LAKEHOUSE_MONITORING
  • PREDICTIVE_OPTIMIZATION
  • ONLINE_TABLES
  • FOUNDATION_MODEL_TRAINING

La columna product_features es un objeto que contiene información sobre las características de producto específicas usadas e incluye los siguientes pares clave-valor:

  • jobs_tier: los valores incluyen LIGHT, CLASSIC o null
  • sql_tier: los valores incluyen CLASSIC, PRO o null
  • dlt_tier: los valores incluyen CORE, PRO, ADVANCED o null
  • is_serverless: los valores incluyen true o false, o bien null
  • is_photon: los valores incluyen true o false, o bien null
  • serving_type: los valores incluyen MODEL, GPU_MODEL, FOUNDATION_MODEL, FEATURE o null

Consultas de ejemplo

Puede usar las siguientes consultas de ejemplo para responder a preguntas comunes sobre el uso facturable:

¿Cuál es la tendencia diaria del consumo de DBU?

SELECT
  usage_date as `Date`, sum(usage_quantity) as `DBUs Consumed`
FROM
  system.billing.usage
WHERE
  sku_name = "STANDARD_ALL_PURPOSE_COMPUTE"
GROUP BY
  usage_date
ORDER BY
  usage_date ASC

¿Cuántas DTU de cada producto se han usado a lo largo de este mes?

SELECT
    billing_origin_product,
    usage_date,
    sum(usage_quantity) as usage_quantity
FROM system.billing.usage
WHERE
    month(usage_date) = month(NOW())
    AND year(usage_date) = year(NOW())
GROUP BY billing_origin_product, usage_date

¿Qué trabajos consumieron la mayoría de DBU?

SELECT
  usage_metadata.job_id as `Job ID`, sum(usage_quantity) as `Usage`
FROM
  system.billing.usage
WHERE
  usage_metadata.job_id IS NOT NULL
GROUP BY
  `Job ID`
ORDER BY
  `DBUs` DESC

¿Cuánto uso se puede atribuir a los recursos con una etiqueta específica?

Puede desglosar los costos de varias maneras. En este ejemplo se muestra cómo desglosar los costos por una etiqueta personalizada. Asegúrese de reemplazar la clave y el valor de la etiqueta personalizada en la consulta.

SELECT
  sku_name, usage_unit, SUM(usage_quantity) as `Usage`
FROM
  system.billing.usage
WHERE
  custom_tags.{{key}} = "{{value}}"
GROUP BY 1, 2

Mostrarme los productos en los que el uso está creciendo

SELECT
  after.billing_origin_product, before_dbus, after_dbus, ((after_dbus - before_dbus)/before_dbus * 100) AS growth_rate
FROM
  (SELECT
     billing_origin_product, sum(usage_quantity) as before_dbus
   FROM
     system.billing.usage
   WHERE
     usage_date BETWEEN "2023-04-01" and "2023-04-30"
   GROUP BY
     billing_origin_product
  ) as before
JOIN
  (SELECT
     billing_origin_product, sum(usage_quantity) as after_dbus
   FROM
     system.billing.usage
   WHERE
     usage_date
   BETWEEN
     "2023-05-01" and "2023-05-30"
   GROUP BY
     billing_origin_product
  ) as after
WHERE
  before.billing_origin_product = after.billing_origin_product
SORT BY
  growth_rate DESC

¿Cuál es la tendencia de uso de Proceso de todos los propósitos (Photon)?

SELECT
  sku_name,
  usage_date,
  sum(usage_quantity) as `DBUs consumed`
FROM
  system.billing.usage
WHERE
  year(usage_date) = year(CURRENT_DATE)
AND
  sku_name = "ENTERPRISE_ALL_PURPOSE_COMPUTE_(PHOTON)"
AND
  usage_date > "2023-04-15"
GROUP BY
  sku_name, usage_date

¿Cuál es el consumo de DBU de una vista materializada o una tabla de streaming?

Para obtener el uso de DBU y la SKU para una vista materializada específica o una tabla de streaming, envía una consulta a la tabla del sistema de uso facturable para los registros donde usage_metadata.dlt_pipeline_id se establece en el identificador de la canalización asociada a la vista materializada o la tabla de streaming. Puedes encontrar el identificador de canalización en la pestaña Detalles al ver la vista materializada pertinente o la tabla de streaming. Para limitar de manera opcional el consumo por fecha, especifica una fecha de inicio, una fecha de finalización o un intervalo de fechas. La consulta siguiente recupera el uso de DBU para la canalización con el identificador 00732f83-cd59-4c76-ac0d-57958532ab5b y una fecha de inicio de uso de 2023-05-30:

SELECT
  sku_name,
  usage_date,
  SUM(usage_quantity) AS `DBUs`
FROM
  system.billing.usage
WHERE
  usage_metadata.dlt_pipeline_id = "00732f83-cd59-4c76-ac0d-57958532ab5b"
AND
  usage_start_time > "2023-05-30"
GROUP BY
  ALL

¿Cuál es el consumo de DBU de una canalización DLT sin servidor?

Para obtener el uso de DBU y la SKU de una canalización de DLT sin servidor, envía una consulta a la tabla del sistema de uso facturable para los registros donde usage_metadata.dlt_pipeline_id se establece en el identificador de la canalización. Puedes encontrar el identificador de canalización en la pestaña Detalles de canalización al ver una canalización en la interfaz de usuario de Delta Live Tables. Para limitar de manera opcional el consumo por fecha, especifica una fecha de inicio, una fecha de finalización o un intervalo de fechas. La consulta siguiente recupera el uso de DBU de diciembre de 2023 para la canalización con el identificador 00732f83-cd59-4c76-ac0d-57958532ab5b.

SELECT
  sku_name,
  usage_date,
  SUM(usage_quantity) AS `DBUs`
FROM
  system.billing.usage
WHERE
  usage_metadata.dlt_pipeline_id = "00732f83-cd59-4c76-ac0d-57958532ab5b"
AND
  usage_start_time >= "2023-12-01"
AND
  usage_end_time < "2024-01-01"
GROUP BY
  ALL