Guide de dépannage du service de cluster ne parvient pas à démarrer

Article
03/21/2024

Liste de pour la résolution des problèmes

Vérifier les ports utilisés par le service de cluster

Assurez-vous que les ports suivants sont ouverts au trafic de cluster sur tous les pare-feu :

Port 135 : mappeur de point de terminaison d’appel de procédure distante (RPC) ou modèle objet de composant distribué (DCOM).
Port 135 : mappeur de point de terminaison RPC sur le protocole UDP (User DataGram Protocol).
Port 3343 : pilote réseau de cluster.
Port 445 : Bloc de messages serveur (SMB).
Port 139 : service de session NetBIOS.
Ports dans la plage de 5000 à 5099 : si l’ID d’événement 1721 est enregistré lorsque vous vous connectez à un cluster en tant qu’administrateur de cluster, essayez d’ouvrir les ports de cette plage (ou d’autres ports) au trafic RPC. Les ports prennent en charge la communication via RPC, sauf si vous tapez simplement un caractère de point (.).

Ce problème peut se produire car le service de cluster utilise au moins 100 ports pour la communication RPC. Le nombre de ports disponibles pour le service de cluster peut devenir trop faible lorsque d’autres services utilisent certains des ports nécessaires. Ces services peuvent inclure le service DNS Windows, le service Wins (Windows Internet Name) ou le service Microsoft SQL Server.
Ports de la plage 8011 à 8031 : si les pare-feu séparent les nœuds de cluster, les ports de la plage 8011 à 8031 doivent être ouverts au trafic RPC entre nœuds. Sinon, des erreurs dans le journal du cluster indiquent qu’un nœud de sponsor n’est pas disponible. Ces erreurs se produisent car il n’y a pas suffisamment de ports disponibles pour la communication RPC entre un nœud qui tente de joindre le cluster et un nœud qui peut parrainer ce nœud.

Pour plus d’informations sur la configuration d’un réseau et de ports réseau pour un cluster, consultez les articles suivants :

Après avoir modifié les paramètres du port, essayez de remettre le nœud en ligne avant de continuer.

Exécuter l’outil de validation de cluster

Ouvrez le composant logiciel enfichable Gestionnaire du cluster de basculement (CluAdmin.msc).
Sélectionnez Gestionnaire du cluster de basculement dans la colonne supérieure gauche.
Sélectionnez Valider la configuration.
Tapez le nom de chaque nœud du cluster et sélectionnez Ajouter après chacun d’eux.
Lorsque tous les nœuds ont été ajoutés à la liste Serveurs sélectionnés : , sélectionnez Suivant.
Sélectionnez Exécuter tous les tests (recommandé)>Suivant>Suivant.
Laissez le test se terminer. Une fois l’opération terminée, sélectionnez Afficher le rapport.
Passez en revue les résultats des tests étiquetés comme Ayant échoué ou Avertissement. Ces informations peuvent vous aider à fournir des étapes exploitables pour résoudre le problème.
Pour obtenir un fichier téléchargeable, accédez au dossier C :\Windows\Cluster\Reports et ouvrez le rapport de validation (. MHT) fichier.

Remarque

Dans Windows Server 2016 et versions ultérieures, il s’agit d’un fichier .HTM.

Vérifier les stratégies de sécurité susceptibles d’affecter le nœud de cluster

Dans la Rédacteur d’objets stratégie de groupe, ces objets de stratégie se trouvent dans Configuration ordinateur\Paramètres Windows\Paramètres de sécurité\Stratégies locales\Affectation des droits utilisateur.

Remarque

Pour accéder aux paramètres de stratégie de sécurité locale, sélectionnez Démarrer, tapez stratégie de sécurité locale, puis stratégie de sécurité locale.

Vérifiez que la liste des comptes inclut les comptes responsables de l’exécution du nœud de cluster. Pour plus d’informations, consultez Comment accéder à cet ordinateur à partir du réseau et Autoriser la connexion localement au paramètre de stratégie de sécurité.
Assurez-vous que la liste des comptes n’inclut pas les comptes locaux. Pour plus d’informations, consultez Comment refuser l’accès à cet ordinateur à partir du réseau.
Assurez-vous que la liste des comptes et des groupes n’inclut pas le groupe « Tout le monde ». Pour plus d’informations, consultez Refuser la connexion au paramètre de stratégie de sécurité localement.

Après avoir modifié les paramètres de stratégie, essayez de remettre le nœud en ligne avant de continuer.

Désactiver temporairement les pare-feu

Désactivez le pare-feu entre le nœud et le reste du cluster, puis essayez de remettre le nœud en ligne. Si le nœud n’est toujours pas en ligne, le pare-feu peut en être la cause.

Importante

Ne laissez pas cette modification en place une fois que vous avez terminé la résolution des problèmes. Après avoir utilisé cette modification à des fins de test, retournez ces paramètres à la configuration d’origine.

Vérifier les problèmes liés au matériel et aux logiciels réseau

Vérifiez dans le journal des événements système les erreurs matérielles ou logicielles liées aux cartes réseau sur ce nœud.
Vérifiez la carte réseau, les câbles et la configuration réseau pour les réseaux qui connectent les nœuds.
Si vous associez les cartes réseau, vérifiez que la configuration de l’association est correcte.
Vérifiez les hubs, les commutateurs ou les ponts dans les réseaux qui connectent les nœuds.

Examiner les fichiers journaux

Pour identifier la source du problème, passez en revue les informations de journal provenant de plusieurs sources. Par exemple :

Dans observateur d'événements, accédez à Journaux des applications et des services\Microsoft\Windows\FailoverClustering-Client\Diagnostic, puis passez en revue les journaux de suivi de débogage de l’API de cluster.
Générez un nouveau journal de cluster pour le nœud. Sur le serveur qui exécute le nœud affecté, ouvrez une invite PowerShell avec élévation de privilèges et exécutez l’applet de commande suivante :

Get-ClusterLog -Node 'Local Node Name' -Destination c:\temp -UseLocalTime

Pour générer une trace plus détaillée, procédez comme suit :

À une invite PowerShell avec élévation de privilèges, exécutez l’applet de commande suivante pour démarrer la trace :

logman create trace "base_cluster" -ow -o c:\base_cluster.etl -p "Microsoft-Windows-FailoverClustering-Client" 0xffffffffffffffff 0xff -nb 16 16 -bs 1024 -mode Circular -f bincirc -max 4096 -ets
Reproduisez le problème.
Pour arrêter la trace, exécutez l’applet de commande suivante :

Logman stop base_cluster.etl -ets
Pour convertir la trace, exécutez l’applet de commande suivante :

Netsh trace convert base_cluster.etl
Pour générer un journal de cluster à partir des données, exécutez l’applet de commande suivante :

Get-ClusterLog -Node 'Local Node Name' -Destination c:\temp -UseLocalTime

Pour plus d’informations sur le suivi et d’autres problèmes à examiner, consultez Comment résoudre les problèmes de création d’échecs de cluster.

Partager via