Surveillance et gestion de SharePoint Server 2010

 

S’applique à : SharePoint Server 2010

Dernière rubrique modifiée : 2015-03-09

Cet article fournit des informations sur la surveillance et sur les compteurs de performance liés aux batteries de serveurs Microsoft SharePoint Server 2010. Pour gérer les performances système de SharePoint Server 2010, vous devez surveiller votre serveur afin d’identifier les goulots d’étranglement potentiels. Avant de passer à la surveillance proprement dite, vous devez comprendre les indicateurs clés qui vous révéleront si une partie de votre batterie de serveurs nécessite une attention particulière et savoir comment interpréter ces indicateurs. Si vous constatez que le fonctionnement de votre batterie de serveurs s’écarte des cibles que vous avez définies, vous pouvez ajuster votre batterie de serveurs en ajoutant ou en supprimant des ressources matérielles, en modifiant votre topologie ou en modifiant le mode de stockage des données.

Les informations de cette section visent à aider les administrateurs à configurer manuellement les compteurs de performance et d’autres paramètres. Pour plus d’informations sur la surveillance de l’intégrité et sur la résolution des problèmes à l’aide des outils de surveillance de l’intégrité intégrés à l’interface de l’Administration centrale de SharePoint, lisez les articles suivants :

Avant de lire cet article, vous devez lire l’article Vue d’ensemble de la gestion et du dimensionnement de la capacité pour SharePoint Server 2010.

Dans cet article :

  • Configuration de la surveillance

  • Suppression des goulots d’étranglement

Configuration de la surveillance

La liste ci-après répertorie les paramètres que vous pouvez modifier pour surveiller votre environnement à ses débuts, ce qui vous permettra de déterminer si des modifications sont nécessaires. Gardez à l’esprit que l’augmentation de vos capacités de surveillance aura une incidence sur la quantité d’espace disque dont aura besoin votre base de données d’utilisation. Une fois que l’environnement est stable et que cette surveillance détaillée n’est plus nécessaire, vous pouvez rétablir les valeurs par défaut des paramètres ci-après.

Paramètre Valeur Remarques

Protection de flux du journal des événements

Désactivé

La valeur par défaut est Activé. Vous pouvez le désactiver afin de collecter autant d’informations de surveillance que possible. Pour les opérations normales, il doit être activé.

Planification des travaux du minuteur

   

Importation des données d’utilisation de Microsoft SharePoint Foundation

5 minutes

La valeur par défaut est 30 minutes. La diminution de ce paramètre se traduit par une augmentation de la fréquence d’importation des données dans la base de données d’utilisation et est particulièrement utile lors de la résolution des problèmes. Pour les opérations normales, la valeur doit être de 30 minutes.

Fournisseurs de diagnostic

   

Activer tous les fournisseurs de diagnostic

Activé

La valeur par défaut est Désactivé sauf pour le fournisseur « Analyse du fonctionnement de la recherche - Suivi des événements ». Ces fournisseurs collectent des données d’intégrité pour différentes fonctionnalités et différents composants. Pour les opérations normales, vous pouvez rétablir la valeur par défaut.

Définir les intervalles de planification « travail-diagnostics-compteur-performance-wfe-fournisseur » et « travail-diagnostics-compteur-performance-sql-fournisseur »

1 minute

La valeur par défaut est 5 minutes. La diminution de ce paramètre peut se traduire par une augmentation de la fréquence d’interrogation des données et est particulièrement utile lors de la résolution des problèmes. Pour les opérations normales, la valeur doit être de 5 minutes.

Divers

   

Activer le suivi de pile pour les demandes de contenu

Activé

La valeur par défaut est Désactivé. L’activation de ce paramètre permet de diagnostiquer les échecs de demandes de contenu en utilisant la trace de pile de processus. Pour les opérations normales, ce paramètre doit être désactivé.

Activer le tableau de bord des développeurs

Activé

La valeur par défaut est Désactivé. L’activation de ce paramètre permet de diagnostiquer les pages lentes ou les autres problèmes en utilisant le tableau de bord des développeurs. Pour les opérations normales et une fois que la résolution des problèmes n’est plus nécessaire, ce paramètre doit être désactivé.

Collecte des données d’utilisation

   

Utilisation de l’importation de contenu

Utilisation de l’exportation de contenu

Demandes de page

Utilisation de la fonctionnalité

Utilisation de la requête de recherche

Utilisation de l’inventaire des sites

Travaux du minuteur

Utilisation de l’évaluation

Activé

L’activation de la journalisation de cet ensemble de compteurs vous permet de collecter davantage de données d’utilisation dans l’environnement et de mieux comprendre les modèles de trafic au sein de l’environnement.

Compteurs de performance

Si vous utilisez la base de données d’utilisation, vous pouvez ajouter à celle-ci les compteurs de performance qui facilitent la surveillance et l’évaluation des performances de votre batterie de serveurs, de manière à ce qu’ils soient automatiquement journalisés selon un intervalle spécifique (30 minutes par défaut). Ainsi, vous pouvez interroger la base de données d’utilisation pour récupérer ces compteurs et générer un graphique des résultats dans le temps. Voici un exemple d’utilisation de l’applet de commande PowerShell Add-SPDiagnosticsPerformanceCounter pour ajouter le compteur % temps processeur à la base de données d’utilisation. Il n’est nécessaire d’exécuter cette commande que sur un seul serveur Web :

Add-SPDiagnosticsPerformanceCounter -Category "Processor" -Counter "% Processor Time" -Instance "_Total" -WebFrontEnd

Pour tout système serveur, vous devez surveiller une série de compteurs de performance génériques. Le tableau suivant décrit ces compteurs de performance.

Compteur de performance Description

Processeur

Vous devez surveiller les performances du processeur afin de vous assurer que la totalité de l’utilisation du processeur ne demeure pas constamment élevée (plus de 80 %), car cela indique que le système ne pourrait pas prendre en charge une augmentation soudaine des activités. Cette surveillance a également pour objet d’éviter un effet domino si la défaillance d’un composant entraîne un dysfonctionnement des autres composants. Par exemple, si vous disposez de trois serveurs Web, vous devez vous assurer que l’utilisation moyenne de l’UC dans tous les serveurs est inférieure à 60 % de telle sorte qu’en cas de défaillance de l’un d’eux, il soit toujours possible pour les deux autres de traiter la charge supplémentaire.

Interface réseau

Surveillez le taux auquel les données sont envoyées et reçues via la carte d’interface réseau. Ce taux doit demeurer inférieur à 50 % de la capacité du réseau.

Disques et cache

Vous devez surveiller régulièrement une série d’options de disque logique. L’espace disque disponible est essentiel dans toute étude de capacité, mais vous devez également examiner la durée pendant laquelle le disque est inactif. Suivant les types d’applications ou de services que vous exécutez sur vos serveurs, vous pouvez examiner les heures de lecture et d’écriture sur disque. Une mise en file d’attente prolongée des opérations d’écriture ou de lecture aura une incidence sur les performances. Le cache a un impact majeur sur les opérations de lecture et d’écriture. Vous devez déterminer si les échecs du cache sont en augmentation.

Mémoire et fichier d’échange

Surveillez la quantité de mémoire physique pouvant être allouée. Une insuffisance de mémoire aboutit à une utilisation excessive du fichier d’échange et à une augmentation du nombre de défauts de page par seconde.

Compteurs système

Le tableau suivant fournit des informations sur les objets et compteurs système que vous pouvez ajouter au jeu de compteurs surveillés dans la base de données d’utilisation en utilisant la commande SPDiagnosticPerformanceCounter sur un serveur Web.

Objets et compteurs Description

Processeur

 

% temps processeur

Ce paramètre indique l’utilisation du processeur pendant une période de temps. Si cette valeur demeure constamment excessive, cela peut porter préjudice aux performances. Pensez à établir un décompte total dans les systèmes multiprocesseurs. Vous pouvez également mesurer l’utilisation sur chaque processeur, afin que les performances soient équilibrées entre les cœurs.

Disque

 

Longueur moyenne de la file d’attente du disque

Ce paramètre indique le nombre moyen de demandes de lecture et d’écriture mises en file d’attente pour le disque sélectionné pendant l’intervalle d’échantillonnage. Une file d’attente de disque plus longue n’est pas nécessairement un problème, à condition que les lectures/écritures sur disque n’en pâtissent pas et que le système fonctionne dans un état stable sans que la mise en file d’attente n’augmente indéfiniment.

Longueur moyenne de file d’attente lecture disque

Nombre moyen de demandes de lecture mises en file d’attente.

Longueur moyenne de file d’attente écriture disque

Nombre moyen de demandes d’écriture mises en file d’attente.

Lectures disque/s

Nombre de lectures sur disque par seconde.

Ecritures disque/s

Nombre d’écritures sur disque par seconde.

Mémoire

 

Mégaoctets disponibles

Ce paramètre indique la quantité de mémoire physique pouvant être allouée. Une insuffisance de mémoire aboutit à une utilisation excessive du fichier d’échange et à une augmentation du nombre de défauts de page par seconde.

Défauts de cache/s

Ce compteur indique le taux auquel les défauts se produisent lorsqu’une page est recherchée dans le cache du système de fichiers et qu’elle demeure introuvable. Il peut s’agir d’un défaut logiciel, si la page se trouve dans la mémoire, ou d’un défaut matériel, si la page se trouve sur le disque.

L’utilisation effective du cache pour les opérations de lecture et d’écriture peut avoir un impact significatif sur les performances des serveurs. Vous devez déterminer si les défauts de cache sont en augmentation, ce qu’indique une réduction de la valeur du compteur Lectures rapides async/s ou Lectures en avance/s.

Pages/s

Ce compteur indique le taux auquel les pages sont lues à partir du disque et écrites sur celui-ci pour faciliter la résolution des défauts de page matériels. L’augmentation de ce taux indique l’existence de problèmes de performances à l’échelle du système.

Fichier d’échange

 

Pourcentage d’utilisation et pourcentage de pic d’utilisation

Le fichier d’échange du serveur contient des adresses mémoire « virtuelles » du disque. Les défauts de page se produisent lorsqu’un processus doit s’arrêter et attendre que des ressources « virtuelles » requises soient récupérées en mémoire à partir du disque. Ces erreurs sont d’autant plus fréquentes que la mémoire physique est inappropriée.

Carte réseau

 

Octets totaux/s

Il s’agit du taux auquel les données sont envoyées et reçues via la carte d’interface réseau. Vous pouvez être amené à approfondir l’analyse afin de déterminer si ce taux est supérieur à 40-50 % de la capacité du réseau. Pour affiner votre recherche, surveillez les compteurs Octets reçus/s et Octets envoyés/s.

Processus

 

Jeu de travail

Ce compteur indique la taille actuelle (en octets) du jeu de travail pour un processus donné. Cette mémoire est réservée au processus, même si elle n’est pas en cours d’utilisation.

% temps processeur

Ce compteur indique le pourcentage de temps processeur utilisé par un processus donné.

Nombre de threads (_Total)

Nombre actuel de threads.

ASP.NET

 

Nb total de demandes

Nombre total de demandes depuis le démarrage du service.

Nb de demandes en attente

Microsoft SharePoint Foundation 2010 fournit les blocs de construction des pages HTML qui sont restituées dans le navigateur de l’utilisateur via HTTP. Ce compteur indique le nombre de demandes en attente de traitement.

Durée d’attente de la demande

Durée, en millisecondes, pendant laquelle la demande la plus récente est demeurée dans la file d’attente avant d’être traitée. Lorsque le nombre d’événements d’attente augmente, la restitution des pages est moins performante du point de vue de l’utilisateur.

Demandes rejetées

Nombre total de demandes non exécutées en raison de ressources serveur insuffisantes. Ce compteur représente le nombre de demandes qui retournent un code d’état HTTP 503, indiquant que le serveur est encombré.

Nb de demandes en cours d’exécution (_Total)

Nombre de demandes en cours d’exécution.

Nb de requêtes/s (_Total)

Nombre de demandes exécutées par seconde. Cette valeur représente le débit actuel de l’application. Lorsque la charge est constante, ce nombre doit demeurer dans une certaine plage, à l’exclusion des autres tâches de serveur (telles que le nettoyage de la mémoire, le thread de nettoyage du cache, les outils serveur externes, etc.).

Mémoire CLR .NET

 

Nombre de collections de la génération 0

Affiche le nombre de fois que les objets de la génération 0 (c’est-à-dire les objets les plus jeunes et les plus récemment alloués) ont été récupérés par le garbage collector depuis le démarrage de l’application. Ce nombre est utile en tant que rapport nombre de collections de la génération 0 : nombre de collections de la génération 1 : nombre de collections de la génération 2 pour vérifier que le nombre de collections de la génération 2 ne dépasse pas exagérément le nombre de collections de la génération 0, idéalement d’un facteur de 2.

Nombre de collections de la génération 1

Affiche le nombre de fois que les objets de la génération 1 ont été récupérés par le garbage collector depuis le démarrage de l’application.

Nombre de collections de la génération 2

Affiche le nombre de fois que les objets de la génération 2 ont été récupérés par le garbage collector depuis le démarrage de l’application. Le compteur est incrémenté à la fin d’un nettoyage de mémoire de la génération 2 (également appelé nettoyage de mémoire complet).

% temps dans le GC

Affiche le pourcentage de temps écoulé qui a été consacré à la réalisation d’un nettoyage de mémoire depuis le dernier cycle de nettoyage de mémoire. En règle générale, ce compteur indique le travail qu’a réalisé le garbage collector pour collecter et compacter la mémoire pour le compte de l’application. Ce compteur n’est mis à jour qu’à la fin de chaque nettoyage de mémoire. Ce compteur n’est pas une moyenne ; sa valeur reflète la dernière valeur observée. Il doit être inférieur à 5 % pendant une opération normale.

Compteurs SQL Server

Le tableau suivant fournit des informations sur les objets et compteurs SQL Server.

Objets et compteurs Description

Statistiques générales

Cet objet fournit les compteurs permettant d’analyser l’activité générale au niveau du serveur, notamment le nombre de connexions actuelles et le nombre d’utilisateurs se connectant et se déconnectant par seconde d’ordinateurs exécutant une instance de SQL Server.

Connexions utilisateur

Ce compteur indique le volume de connexions utilisateur sur votre instance de SQL Server. Si vous constatez que ce nombre a augmenté de 500 % par rapport à votre ligne de base, une baisse des performances pourrait se faire ressentir.

Bases de données

Cet objet fournit des compteurs pour analyser les opérations de copie en bloc, le débit des sauvegardes et des restaurations, ainsi que l’activité des journaux des transactions. Surveillez les transactions et le journal des transactions pour déterminer l’intensité de l’activité de l’utilisateur dans la base de données et le taux de remplissage du journal des transactions. Le volume d’activité de l’utilisateur peut déterminer les performances de la base de données et affecter la taille du journal, le verrouillage et la réplication. La surveillance de l’activité du journal de bas niveau afin de mesurer l’activité de l’utilisateur et l’exploitation des ressources peut permettre d’identifier les goulots d’étranglement des performances.

Transactions/s

Ce compteur indique le volume de transactions effectuées par seconde sur une base de données spécifique ou sur la totalité de l’instance de SQL Server. Ce nombre est utile dans le cadre de la création d’une ligne de base et de la résolution des problèmes.

Verrous

Cet objet fournit des informations sur les verrous SQL Server sur des types de ressources individuels.

Nombre d’interblocages/s

Ce compteur affiche le nombre d’interblocages sur le serveur SQL Server par seconde. Ce nombre doit normalement être égal à 0.

Temps d’attente moyen (ms)

Ce compteur affiche le temps d’attente moyen pour chaque demande de verrouillage qui a provoqué une attente.

Temps d’attente des verrous (ms)

Ce compteur affiche le temps d’attente total des verrous au cours de la dernière seconde.

Attentes de verrous/s

Ce compteur affiche le nombre de verrous par seconde ne pouvant pas être satisfaits immédiatement et devant attendre des ressources.

Verrous internes

Cet objet fournit les compteurs permettant de surveiller les verrous de ressources SQL Server internes appelés verrous. L’analyse des verrous pour déterminer l’activité des utilisateurs et l’utilisation des ressources peut vous aider à identifier les goulots d’étranglement de performance.

Temps d’attente moyen d’un verrou interne (ms)

Ce compteur affiche le temps d’attente moyen d’un verrou pour les demandes en attente.

Attentes de verrous internes/s

Ce compteur affiche le nombre de demandes de verrous par seconde ne pouvant pas être satisfaites immédiatement.

Statistiques SQL

Cet objet fournit les compteurs pour l’analyse de la compilation et du type de demandes envoyées à une instance de SQL Server. L’analyse du nombre de compilations et recompilations des requêtes ainsi que le nombre de lots reçus par une instance de SQL Server vous donnent une indication de la vitesse à laquelle SQL Server traite les requêtes utilisateur et de l’efficacité avec laquelle l’optimiseur de requêtes traite les requêtes.

Compilations SQL/s

Ce compteur indique le nombre de saisies du chemin d’accès du code de compilation par seconde.

Recompilations SQL/s

Ce compteur indique le nombre de recompilations des instructions déclenchées par seconde.

Plan Cache

Cet objet fournit des compteurs qui permettent de surveiller l’utilisation de la mémoire par SQL Server pour stocker des objets tels que des procédures stockées, des instructions Transact-SQL ad hoc et préparées, ainsi que des déclencheurs.

Taux d’accès au cache

Ce compteur indique le rapport entre les accès au cache et les recherches de plans.

Gestionnaire de tampons

Cet objet fournit des compteurs permettant de surveiller l’utilisation de la mémoire par SQL Server pour stocker des pages de données, des structures de données internes et le cache de procédures, ainsi que des compteurs permettant de surveiller les E/S physiques lorsque SQL Server lit et écrit des pages de bases de données.

Taux d’accès au cache des tampons

Ce compteur affiche le pourcentage de pages trouvées dans le cache des tampons sans avoir eu à lire sur le disque. Le ratio correspond au nombre total d’accès au cache divisé par le nombre total de recherches depuis le démarrage d’une instance de SQL Server.

Suppression des goulots d’étranglement

Les goulots d’étranglement du système représentent un point de conflit au niveau duquel il n’y a pas suffisamment de ressources pour traiter les demandes de transaction utilisateur. Ces goulots peuvent être liés à la configuration matérielle, à l’environnement d’exploitation ou aux applications. Souvent, la raison du goulot d’étranglement est liée à l’inefficacité d’un code personnalisé ou de solutions tierces, et un examen de ces derniers peut s’avérer plus efficace que l’ajout de matériel. Une autre cause courante des goulots d’étranglement est une mauvaise configuration de la batterie de serveurs ou une implémentation de solution inefficace qui structure les données de telle sorte que la configuration obtenue requiert plus de ressources que nécessaire. Il est primordial qu’un administrateur système gère les goulots d’étranglement en surveillant les performances en permanence. Lorsque vous identifiez un problème de performances, vous devez évaluer la meilleure solution pour supprimer le goulot d’étranglement. Les compteurs de performance et autres applications de surveillance des performances, telles que System Center Operations Manager (SCOM), sont les outils indispensables au suivi et à l’analyse des problèmes, et par voie de conséquence au développement optimal d’une solution.

Résolution des goulots d’étranglement physiques

Les goulots d’étranglement physiques sont liés à des conflits qui touchent le processeur, le disque, la mémoire et le réseau : le nombre de demandes est trop élevé par rapport aux ressources physiques. Les objets et compteurs décrits dans la rubrique Surveillance des performances indiquent où le problème de performances se situe, par exemple, au niveau du processeur matériel ou d’ASP.NET. Pour résoudre les goulots d’étranglement, vous devez identifier le problème de performances, puis apporter les modifications permettant de l’atténuer.

Les problèmes se produisent rarement de façon soudaine ; en règle générale, il existe une dégradation progressive des performances, dont vous pouvez effectuer le suivi si vous réalisez une surveillance régulière, à l’aide de votre outil de surveillance des performances ou d’un système plus élaboré, tel que SCOM. Pour ces deux options, à des degrés divers, vous pouvez incorporer des solutions dans une alerte, sous la forme de texte d’avertissement ou de commandes scriptées.

Vous pouvez être amené à résoudre les problèmes de goulot d’étranglement en apportant des modifications aux configurations matérielle ou système, après avoir déterminé qu’ils ne sont pas liés à une mauvaise configuration, à l’inefficacité d’un code personnalisé ou de solutions tierces ou à une implémentation de solution inefficace. Les tableaux suivants identifient les conditions d’apparition des problèmes et les options possibles pour résoudre ces derniers. Certaines des options suggèrent des mises à niveau ou des modifications matérielles.

Objets et compteurs Problème Options de résolution

Processeur

Processeur : Pourcentage de temps processeur

Supérieur à 75-85 %

Mettez à niveau le processeur.

Augmentez le nombre de processeurs.

Ajoutez un ou plusieurs serveurs.

Disque

   

Longueur moyenne de la file d’attente du disque

Augmentation progressive, système dans un état instable et sauvegarde de la file d’attente

Augmentez le nombre ou la vitesse des disques.

Modifiez la configuration pour réduire le volume.

Déplacez une partie des données vers un autre serveur.

% temps inactivité

Supérieur à 90 %

Augmentez le nombre de disques.

Déplacez les données vers un autre disque ou serveur.

% d’espace libre

Inférieur à 30 %

Augmentez le nombre de disques.

Déplacez les données vers un autre disque ou serveur.

Mémoire

   

Mégaoctets disponibles

Moins de 2 Go sur un serveur Web.

Ajoutez de la mémoire.

Notes

La mémoire disponible sur le serveur SQL Server est faible par défaut, et n’indique pas toujours l’existence d’un problème.

Défauts de cache/s

Nombre supérieur à 1

Ajoutez de la mémoire.

Dans la mesure du possible, augmentez la vitesse ou la taille du cache.

Déplacez les données vers un autre disque ou serveur.

Pages/s

Nombre supérieur à 10

Ajoutez de la mémoire.

Fichier d’échange

   

Pourcentage d’utilisation et pourcentage de pic d’utilisation

Le fichier d’échange du serveur contient des adresses mémoire « virtuelles » du disque. Les défauts de page se produisent lorsqu’un processus doit s’arrêter et attendre que des ressources « virtuelles » requises soient récupérées en mémoire à partir du disque. Ces erreurs sont d’autant plus fréquentes que la mémoire physique est inappropriée.

Ajoutez de la mémoire.

Carte réseau

   

Octets totaux/s

Taux supérieur à 40-50 % de la capacité du réseau. Il s’agit du taux auquel les données sont envoyées et reçues via la carte d’interface réseau.

Approfondissez l’analyse en surveillant les compteurs Octets reçus/s et Octets envoyés/s.

Réévaluez la vitesse de la carte d’interface réseau.

Vérifiez le nombre, la taille et l’utilisation des mémoires tampons.

Processus

   

Jeu de travail

Supérieur à 80 % de la mémoire totale

Ajoutez de la mémoire.

% temps processeur

Supérieur à 75-85 %

Augmentez le nombre de processeurs.

Redistribuez la charge de travail vers des serveurs supplémentaires.

ASP.NET

   

Recyclages du pool d’applications

Plusieurs par jour, entraînant un ralentissement intermittent.

Vérifiez que vous n’avez pas défini des paramètres qui recyclent automatiquement le pool d’applications tout au long de la journée alors que cela n’est pas nécessaire.

Nb de demandes en attente

Des centaines ou des milliers de demandes en attente.

Implémentez des serveurs Web supplémentaires.

La valeur maximale par défaut de ce compteur est 5 000 et vous pouvez modifier ce paramètre dans le fichier Machine.config.

Durée d’attente de la demande

Lorsque le nombre d’événements d’attente augmente, la restitution des pages est moins performante du point de vue de l’utilisateur.

Implémentez des serveurs Web supplémentaires.

Demandes rejetées

Nombre supérieur à 0

Implémentez des serveurs Web supplémentaires.

See Also

Concepts

Vue d’ensemble de la gestion et du dimensionnement de la capacité pour SharePoint Server 2010
Test de performances pour SharePoint Server 2010
Planification de la capacité pour SharePoint Server 2010
Surveillance de l’intégrité (SharePoint Server 2010)
Planification et configuration de la capacité de SQL Server et du stockage (SharePoint Server 2010)