Recursos implementados con Clústeres de macrodatos de SQL Server

Se aplica a: SQL Server 2019 (15.x)

Importante

El complemento Clústeres de macrodatos de Microsoft SQL Server 2019 se va a retirar. La compatibilidad con Clústeres de macrodatos de SQL Server 2019 finalizará el 28 de febrero de 2025. Todos los usuarios existentes de SQL Server 2019 con Software Assurance serán totalmente compatibles con la plataforma, y el software se seguirá conservando a través de actualizaciones acumulativas de SQL Server hasta ese momento. Para más información, consulte la entrada de blog sobre el anuncio y Opciones de macrodatos en la plataforma Microsoft SQL Server.

En este artículo se describen los recursos que implementa un clúster de macrodatos de SQL Server.

Un clúster de macrodatos implementa pods en función del perfil de implementación. Para obtener más información, vea Configuraciones predeterminadas.

En este artículo se describen los pods implementados con el perfil aks-dev-test-ha y se incluye un grupo de Spark. Consulte Kubernetes para ver los pods implementados en el clúster. En el ejemplo siguiente se devuelve una lista de pods en un espacio de nombres específico.

kubectl get pods -n <namespace>

Reemplace <namespace> por el nombre del clúster de macrodatos.

Para obtener más información, vea Cómo implementar Clústeres de macrodatos de SQL Server en Kubernetes.

En el diagrama siguiente se muestran los componentes implementados en un clúster de macrodatos:

big-data-cluster-diagram

Para obtener información sobre la arquitectura, vea Presentación de Clústeres de macrodatos de SQL Server.

Pods implementados

En la tabla siguiente se enumeran los pods implementados en un clúster de macrodatos.

Nombre Área
control-<nnnn> Control
controldb-<#> Control
controlwd-<nnnn> Control
logsdb-<#> Control
logsui-<nnnn> Control
metricsdb-<#> Control
metricsdc-<nnnn> Control
metricsui-<nnnn> Control
mgmtproxy-<nnnn> Control
zookeeper-<#> Control
dns-<nnnn> Control
master-<#n> Instancia principal
operator-<nnnn> Instancia principal
compute-<#n>-<#m> Grupo de proceso
data-<#>-<#> Grupo de datos
storage-<#>-<#> Grupo de almacenamiento
nmnode-<#>-<#> Grupo de almacenamiento
sparkhead-<#> Grupo de almacenamiento
appproxy-<#m> Grupo de aplicaciones
gateway-<#> Servicio de puerta de enlace

No todos los pods se incluyen en todos los clústeres de macrodatos. Las implementaciones con alta disponibilidad o la integración con Active Directory incluyen pods específicos.

Pods específicos de alta disponibilidad:

  • operator-<nnnn>
  • zookeeper-<#>

Pods específicos de Active Directory:

  • dns-<nnnn>

En las secciones siguientes se describen los pods y se enumeran los contenedores de cada pod.

Control

Los pods de control proporcionan el servicio de control.

Nombre del pod Count Tipo del controlador de Kubernetes Contenedores
control-# 1 ReplicaSet - controller

- security-support

- fluentbit
controldb 1 StatefulSet - mssql-server

- fluentbit
controlwd 1 ReplicaSet - controlwatchdog
logsdb-# 1 StatefulSet - elasticsearch
logsui 1 ReplicaSet - kibana
metricsdb-# 1 StatefulSet - influxdb
metricsdc 1 por nodo de Kubernetes. DaemonSet - telegraf
metricsui-nnnn 1 ReplicaSet - grafana
mgmtproxy-nnnn 1 ReplicaSet - service-proxy

- fluentbit
dns-nnnn 0 o 1 para la integración de Active Directory ReplicaSet - dns

- fluentbit

Instancia principal

master-<#n> es la instancia maestra de SQL Server.

  • Administra el grupo de datos a través de DDL.
  • Manipula los datos del grupo de datos a través de DML.
  • Descarga la ejecución de consultas de análisis en el grupo de datos.
Nombre del pod Count Tipo del controlador de Kubernetes Contenedores
master-<#n> 1 o más para alta disponibilidad. StatefulSet - mssql-server

- fluentbit

- collectd

- mssql-ha-supervisor *
operator* 0 o 1 para alta disponibilidad ReplicaSet - mssql-ha-operator

* Solo implementaciones de alta disponibilidad. El operador implementa y registra la definición de recursos personalizada para SQL Server y los recursos del grupo de disponibilidad. Cuando se implementa el operador, se registra a sí mismo como un cliente de escucha de notificaciones sobre los recursos de SQL Server que se implementan en el clúster de Kubernetes. mssql-ha-supervisor admite el grupo de disponibilidad.

Cada pod master contiene una instancia de SQL Server. Un implementación de alta disponibilidad incluye tres pods. Cada pod incluye una instancia de SQL Server con bases de datos en un grupo de disponibilidad AlwaysOn de SQL Server.

Incluya pods adicionales en el momento de la implementación, en función de la carga de trabajo.

Grupo de proceso

El grupo de proceso proporciona una instancia de SQL Server para el cálculo.

Nombre del pod Count Tipo del controlador de Kubernetes Contenedores
compute-<#n>-<#m> 1 o más. StatefulSet - mssql-server

- fluentbit

- collectd
  • #n identifica el grupo de proceso.
  • #m identifica el id. de instancia en el grupo.

Las instancias de SQL Server del grupo de proceso no tienen estado. Solo necesitan almacenamiento para tempdb.

Incluya pods adicionales en el momento de la implementación, en función de la carga de trabajo.

Grupo de datos

El grupo de datos proporciona instancias de SQL Server para el almacenamiento y el proceso.

Nombre del pod Count Tipo del controlador de Kubernetes Contenedores
data-<#n>-<#m> 0 o más StatefulSet - mssql-server

- fluentbit

- collectd
  • #n identifica el grupo de datos.
  • #m identifica el id. de instancia en el grupo.

Incluya pods adicionales en el momento de la implementación, en función de la carga de trabajo.

Bloque de almacenamiento

El bloque de almacenamiento proporciona ingesta de datos a través de Spark, almacenamiento en HDFS, acceso a datos a través de HDFS y puntos de conexión de SQL Server.

Nombre del pod Count Tipo del controlador de Kubernetes Contenedores
storage-0-# 1 o más. Incluya pods adicionales en el momento de la implementación, en función de la carga de trabajo. StatefulSet - hadoop

- mssql-server

- fluentbit

nmnode-0-# 1 o más para alta disponibilidad StatefulSet - hadoop

- fluentbit
sparkehead-# 1 o más para alta disponibilidad StatefulSet - hadoop-yarn-jobhistory

- hadoop-livy-sparkhistory

- hadoop-hivemetastore

-- fluentbit
zookeeper 0 o 3 para alta disponibilidad. StatefulSet - zookeeper

- fluentbit

Grupo de aplicaciones

El grupo de aplicaciones se incluye en algunos de los perfiles de configuración de pruebas. El grupo de aplicaciones hospeda los proxies del servicio de aplicación que se definen al implementar las aplicaciones para los clústeres de macrodatos.

appproxy es una API web que se sitúa delante de las aplicaciones del grupo de aplicaciones. Autentica a los usuarios y, después, enruta las solicitudes a las aplicaciones.

Nombre del pod Tipo del controlador de Kubernetes Contenedores
appproxy ReplicaSet - app-service-proxy

- fluentbit

Para obtener más información, vea Introducción a la implementación de aplicaciones en un clúster de macrodatos.

Incluya pods adicionales en el momento de la implementación, en función de la carga de trabajo.

Servicio de puerta de enlace

Los servicios de puerta de enlace proporcionan la puerta de enlace Knox a Spark, HDFS, Yarn y las interfaces de usuario de Yarn y Spark.

Nombre del pod Tipo del controlador de Kubernetes Contenedores
gateway-<#> StatefulSet - knox

- fluentbit

Solo se admite una puerta de enlace.

Referencias de contenedor de código abierto

Para obtener información sobre proyectos y versiones específicos de código abierto, consulte el artículo Referencia de software de código abierto.

Pasos siguientes

Para obtener más información sobre Clústeres de macrodatos de SQL Server, vea los recursos siguientes: