Clústeres de conmutación por error de Windows Server (WSFC) con SQL Server

Artículo
06/13/2017

Un clúster de clústeres de conmutación por error de Windows Server (WSFC) es un grupo de servidores independientes que funcionan conjuntamente para aumentar la disponibilidad de aplicaciones y servicios. SQL Server 2014 aprovecha las ventajas de los servicios y funcionalidades de WSFC para admitir grupos de disponibilidad Always On y SQL Server instancias de clúster de conmutación por error.

Términos y definiciones

Clúster de WSFC Un clúster de clústeres de conmutación por error de Windows Server (WSFC) es un grupo de servidores independientes que funcionan conjuntamente para aumentar la disponibilidad de las aplicaciones y los servicios.

Instancia de clúster de conmutación por error Una instancia de un servicio de Windows que administra un recurso de dirección IP, un recurso de nombre de red y recursos adicionales necesarios para ejecutar una o varias aplicaciones o servicios. Los clientes pueden utilizar el nombre de red para tener acceso a los recursos del grupo de modo similar a utilizar un nombre de equipo para tener acceso a los servicios en un servidor físico. Sin embargo, dado que una instancia de clúster de conmutación por error es un grupo, puede ser objeto de conmutación por error a otro nodo sin que se vean afectados el nombre o la dirección subyacentes.

Nodo Un sistema de Microsoft Windows Server que es un miembro activo o inactivo de un clúster de servidores.

Recurso de clúster Una entidad física o lógica que puede ser propiedad de un nodo, que se pone en línea y se desconecta, se mueve entre los nodos y se administra como un objeto de clúster. Un recurso de clúster puede ser propiedad de un único nodo en cualquier momento.

Grupo de recursos Una colección de recursos de clúster administrados como un único objeto de clúster. Normalmente, un grupo de recursos contiene todos los recursos de clúster necesarios para ejecutar una aplicación o un servicio específicos. La conmutación por error y la conmutación por recuperación siempre actúan en grupos de recursos.

Dependencia de recursos Un recurso en el que depende otro recurso. Si el recurso A depende del recurso B, B es una dependencia de A.

Recurso de nombre de red Un nombre de servidor lógico que se administra como un recurso de clúster. Un recurso de nombre de red debe utilizarse con un recurso de dirección IP.

Propietario preferido: nodo en el que un grupo de recursos prefiere ejecutarse. Cada grupo de recursos está asociado a una lista de propietarios preferidos clasificados en orden de preferencia. Durante la conmutación por error automática, el grupo de recursos se pasa al nodo preferido siguiente en la lista de propietarios preferidos.

Posible propietario Un nodo secundario en el que se puede ejecutar un recurso. Cada grupo de recursos está asociado a una lista de posibles propietarios. Los grupos de recursos pueden ser objeto de conmutación por error solo en los nodos enumerados como posibles propietarios.

Modo de cuórum La configuración de cuórum en un clúster de conmutación por error que determina el número de errores de nodo que el clúster puede admitir.

Cuórum forzado El proceso para iniciar el clúster aunque solo haya una minoría de los elementos necesarios para el cuórum están en comunicación.

Para obtener más información, vea el Glosario de clústeres de conmutación por error

Información general de clústeres de conmutación por error de Windows Server

Los clústeres de conmutación por error de Windows Server proporcionan características de infraestructura que admiten escenarios de alta disponibilidad y recuperación ante desastres de aplicaciones de servidor hospedadas, como Microsoft SQL Server y Microsoft Exchange. Si un nodo o un servicio de clúster tiene un error, los servicios hospedados en ese nodo se pueden transferir automática o manualmente a otro nodo disponible en un proceso denominado conmutación por error.

Los nodos del clúster de WSFC trabajan juntos para proporcionar colectivamente estos tipos de funciones:

Notificaciones y metadatos distribuidos. El servicio de WSFC y lo metadatos de aplicaciones hospedadas se mantiene en cada nodo del clúster. Estos metadatos incluyen la configuración y el estado de WSFC además de la configuración de la aplicación hospedada. Los cambios en los metadatos o el estado de un nodo se propagan automáticamente a los demás nodos del clúster.
Administración de recursos. Los nodos individuales del clúster pueden proporcionar recursos físicos como almacenamiento asociado directo, interfaces de red y acceso al almacenamiento en disco compartido. Las aplicaciones hospedadas se registran como un recurso de clúster y pueden configurar dependencias de inicio y de estado en otros recursos.
Supervisión de estado. La detección del estado del nodo principal y entre nodos se realiza mediante una combinación de comunicaciones de red de tipo latido y supervisión de recursos. Los votos de un quórum de nodos del clúster determinan el estado general del clúster.
Coordinación de conmutación por error. Cada uno de los recursos se configura para ser hospedado en un nodo principal y se pueden transferir automática o manualmente a uno o varios nodos secundarios. Una directiva de conmutación por error basada en el estado controla la transferencia automática de la propiedad de recursos entre los nodos. Los nodos y las aplicaciones hospedadas son informadas cuando se produce la conmutación por error para puedan reaccionar correctamente.

Para obtener más información, vea el tema sobre clústeres de conmutación por error en Windows Server 2008 R2

Tecnologías de SQL Server AlwaysOn y WSFC

SQL Server 2014 AlwaysOn es una nueva solución de alta disponibilidad y recuperación ante desastres que aprovecha WSFC. AlwaysOn proporciona una solución integrada y flexible que aumentar la disponibilidad de las aplicaciones, proporciona mejores réditos en inversiones de hardware y simplificar la implementación y administración de alta disponibilidad.

Tanto Always On grupos de disponibilidad como instancias de clúster de conmutación por error AlwaysOn usan WSFC como tecnología de plataforma, registrando componentes como recursos de clúster de WSFC. Los recursos relacionados se combinan en un grupo de recursosque pueden hacerse dependientes de otros recursos de clúster de WSFC. Después, el servicio de clúster WSFC puede detectar y indicar la necesidad de reiniciar la instancia de SQL Server o conmutar por error automáticamente a un nodo de servidor diferente en el clúster de WSFC.

Importante

Para aprovechar al máximo SQL Server tecnologías AlwaysOn, debe aplicar varios requisitos previos relacionados con WSFC.

Para obtener más información, consulte: Requisitos previos, restricciones y recomendaciones para grupos de disponibilidad AlwaysOn (SQL Server).

Alta disponibilidad en el nivel de instancia con instancias de clúster de conmutación por error AlwaysOn

Una instancia de clúster de conmutación por error (FCI) de AlwaysOn es una instancia de SQL Server que se instala en los nodos de un clúster de WSFC. Este tipo de instancia tiene dependencias de recursos en un almacenamiento en disco compartido (a través de canal de fibra o SAN iSCSI) y en un nombre de red virtual. El nombre de red virtual tiene una dependencia de recursos en una o más direcciones IP virtuales, cada una en una subred diferente. El servicio SQL Server y el servicio del Agente SQL Server se registran como recursos, y ambos se hacen dependientes del recurso de nombre de red virtual.

En caso de conmutación por error, el servicio de WSFC transfiere la propiedad de los recursos de la instancia a un nodo de conmutación por error designado. La instancia de SQL Server vuelve a iniciarse en el nodo de conmutación por error y las bases de datos se recuperan de la forma habitual. En cualquier momento determinado, solo un nodo del clúster puede hospedar la FCI y los recursos subyacentes.

Nota:

Una instancia de clúster de conmutación por error AlwaysOn requiere almacenamiento en disco compartido simétrico como una red de área de almacenamiento (SAN) o un recurso compartido de archivos SMB. Los volúmenes de almacenamiento en disco compartido deben estar disponible para todos los nodos potenciales de conmutación por error en el clúster de WSFC.

Para más información, consulte: Instancias de clúster de conmutación por error AlwaysOn.

Alta disponibilidad de nivel de base de datos con grupos de disponibilidad de Always On

Un grupo de disponibilidad es un conjunto de bases de datos de usuario que realizan la conmutación por error conjuntamente. Un grupo de disponibilidad consta de una réplica de disponibilidad principal y de una a cuatro réplicas secundarias que se mantienen mediante el movimiento de datos basado en registros de SQL Server para la protección de datos sin necesidad de almacenamiento compartido. Cada réplica está hospedada por una instancia de SQL Server en un nodo diferente del clúster de WSFC. El grupo de disponibilidad y un nombre de red virtual correspondiente se registran como recursos del clúster de WSFC.

Un agente de escucha de grupo de disponibilidad del nodo de la réplica principal responde a las solicitudes de cliente entrantes para conectarse al nombre de red virtual y, en función de los atributos de la cadena de conexión, redirige cada solicitud a la instancia adecuada de SQL Server .

En el caso de una conmutación por error, en lugar de transferir la propiedad de los recursos físicos compartidos a otro nodo, WSFC aprovecha para volver a configurar una réplica secundaria en otra instancia de SQL Server y que se convierta en la réplica principal del grupo de disponibilidad. El recurso de nombre de red virtual del grupo de disponibilidad se transfiere después a esa instancia.

En cualquier momento dado, solo una instancia de SQL Server puede hospedar la réplica principal de las bases de datos de un grupo de disponibilidad, todas las réplicas secundarias asociadas deben residir cada una en una instancia independiente, y cada instancia debe residir en nodos físicos distintos.

Nota:

Always On los grupos de disponibilidad no requieren la implementación de una instancia de clúster de conmutación por error ni el uso del almacenamiento compartido simétrico (SAN o SMB).

Una instancia de clúster de conmutación por error (FCI) se puede usar junto con un grupo de disponibilidad para mejorar la disponibilidad de una réplica de disponibilidad. Sin embargo, para evitar posibles condiciones de carrera en el clúster de WSFC, la conmutación automática por error del grupo de disponibilidad no se admite en o desde una réplica de disponibilidad hospedada en una FCI.

Para obtener más información, consulte Introducción a los grupos de disponibilidad AlwaysOn (SQL Server)

Seguimiento de estado y conmutación por error de WSFC

La alta disponibilidad para una solución de AlwaysOn se consigue mediante la supervisión de estado proactiva de los recursos de clúster de WSFC físicos y lógicos, junto con la conmutación por error automática y la reconfiguración de hardware redundante. Un administrador del sistema también puede iniciar una conmutación por error manual de un grupo de disponibilidad o una instancia de SQL Server entre nodos.

Directivas de conmutación por error para nodos, instancias de clúster de conmutación por error y grupos de disponibilidad

Una directiva de conmutación por error se configura en el nodo de clúster de WSFC, la instancia de clúster de conmutación por error (FCI) SQL Server y los niveles de grupo de disponibilidad. Estas directivas, basadas en la gravedad, duración y frecuencia del estado incorrecto de los recursos de clúster y la capacidad de respuesta de los nodos, puede desencadenar el reinicio de un servicio o una conmutación automática por error de los recursos de clúster entre nodos, o puede desencadenar el paso de la réplica principal de un grupo de disponibilidad desde una instancia de SQL Server a otra.

La conmutación por error de la réplica de un grupo de disponibilidad no afecta a la instancia de SQL Server subyacente. La conmutación por error de una FCI mueve las réplicas hospedadas de grupo de disponibilidad con la instancia.

Para obtener más información, vea: Directiva de conmutación por error para instancias de clústeres de conmutación por error.

Detección del estado de los recursos de WSFC

Cada recurso de un nodo de clúster de WSFC puede notificar su condición y estado periódicamente o a petición. Una variedad de circunstancias puede indicar el error de recursos. Por ejemplo, una interrupción del suministro eléctrico, errores de disco o de memoria, errores de la comunicación de red o servicios que no responden.

Los recursos de clúster de WSFC como redes, almacenamiento o servicios se pueden hacer dependientes unos de otros. El estado acumulativo de un recurso está determinado por la acumulación sucesiva de su condición con el estado de cada una de sus dependencias de recursos.

Detección del estado entre nodos de WSFC y votos de quórum

Cada nodo de un clúster WSFC participa en la comunicación periódica de latido para compartir el estado de mantenimiento del nodo con los demás nodos. Los nodos que no responden se consideran que se encuentran en estado de error.

Un conjunto de nodos de quórum es una mayoría de los nodos con derecho a voto y testigos en el clúster WSFC. Un voto de quórumperiódico determina el estado general de un clúster WSFC. La presencia de un quórum significa que el clúster es correcto y puede proporcionar tolerancia a errores de nivel de nodo.

En el nivel de clúster de WSFC se configura un modo de quórum que dicta la metodología empleada para los votos de quórum y cuándo se ha de realizar una conmutación por error automática o poner el clúster sin conexión.

Sugerencia

Se recomienda tener siempre un número impar de votos de quórum en un clúster de WSFC. A efectos de los votos de quórum, no es necesario que SQL Server esté instalado en todos los nodos del clúster. Un servidor adicional puede actuar como miembro de quórum, o el modelo de quórum de WSFC se puede configurar para que se use un recurso compartido de archivos remoto como factor de desempate.

Para más información, consulte Configuración de los votos y modos de cuórum WSFC (SQL Server).

Recuperación ante desastres mediante quórum forzado

En función de las prácticas operativas y la configuración del clúster de WSFC, puede incurrir en conmutaciones por error automáticas y manuales y mantener una solución sólida y tolerante a errores SQL Server AlwaysOn. Sin embargo, si un quórum de los nodos con derecho a voto del clúster de WSFC no puede comunicarse con otro, o si el clúster de WSFC tiene un error en la validación del estado, el clúster de WSFC puede pasar a estar sin conexión.

Si el clúster de WSFC pasa a estar sin conexión debido a un desastre imprevisto o debido a un error persistente de hardware o de comunicaciones, se requiere la intervención manual administrativa para forzar un cuórum y poner de nuevo en línea los nodos de clúster supervivientes en una configuración sin tolerancia a errores.

Posteriormente, también debe realizarse una serie de pasos para volver a configurar el clúster de WSFC, recuperar las réplicas de base de datos afectadas y restablecer un nuevo quórum.

Para más información, consulte: Recuperación ante desastres del clúster WSFC mediante cuórum forzado (SQL Server)

Relación de los componentes de SQL Server AlwaysOn con WSFC

Existen varias capas de relaciones entre SQL Server características y componentes de WSFC y AlwaysOn.

Los grupos de disponibilidad AlwaysOn se hospedan en instancias de SQL Server. Una solicitud de cliente que especifica un nombre de red de escucha de grupo de disponibilidad lógico para conectarse a una base de datos principal o secundaria se redirige al nombre de red de instancia adecuado de la instancia de SQL Server subyacente o SQL Server instancia de clúster de conmutación por error (FCI).

Las instancias de SQL Server se hospedan activamente en un solo nodo. Si está presente, una Instancia de SQL Server independiente reside siempre en un único Nodo con un nombre de red de instancia estático. Si está presente, una FCI de SQL Server está activa en uno de dos o más nodos de conmutación por error posibles con un único Nombre de red de instancia virtual.

Los nodos son miembros de un clúster de WSFC. Los metadatos de configuración de WSFC y el estado de todos los nodos se almacenan en cada nodo. Cada servidor puede proporcionar volúmenes asimétricos de almacenamiento o almacenamiento compartido (SAN) para las bases de datos del sistema o de usuario. Cada servidor tiene al menos una interfaz de red física en una o varias subredes IP.

El servicio WSFC supervisa el estado y administra la configuración de un grupo de servidores. El servicio de Clúster de conmutación por error de Windows Server (WSFC) propaga los cambios en los metadatos y el estado de Configuración de WSFC a todos los nodos del clúster. Los metadatos y el estado parciales se pueden almacenar en un recurso compartido de archivos remoto de testigo de quórum de WSFC. Dos o más nodos o testigos activos constituyen un quórum para votar sobre el estado del clúster de WSFC.

Always On las claves del Registro de grupos de disponibilidad son subclaves del clúster de WSFC. Si elimina y vuelve a crear un clúster WSFC, debe deshabilitar y volver a habilitar la característica grupos de disponibilidad de Always On en cada instancia de servidor habilitada para Always On grupos de disponibilidad en el clúster WSFC original. Para más información, vea Habilitar y deshabilitar grupos de disponibilidad de AlwaysOn (SQL Server).

Diagrama de contexto de componentes alwaysOn de SQL Server

Related Tasks

Contenido relacionado

Consulte también

Instancias de clúster de conmutación por error AlwaysOn (SQL Server)Introducción a los grupos de disponibilidad AlwaysOn (SQL Server)Modos de cuórum de WSFC y configuración de votación (SQL Server)Directiva de conmutación por error para instancias de clúster de conmutación por error WSFC recuperación ante desastres a través del cuórum forzado (SQL Server)

Compartir a través de