Meilleures pratiques Linux concernant les options de montage NFS pour Azure NetApp Files
Cet article vous aide à comprendre les options de montage et les meilleures pratiques relatives à leur utilisation avec Azure NetApp Files.
Nconnect
L’utilisation de l’option de montage nconnect
vous permet de spécifier le nombre de connexions (flux réseau) qui doivent être établies entre le client NFS et le point de terminaison NFS, dans une limite de 16 connexions. Normalement, un client NFS utilise une seule connexion entre lui-même et le point de terminaison. L’augmentation du nombre de flux réseau augmente considérablement les limites maximales d’E/S et de débit. D’après nos tests, nconnect=8
permet d’obtenir les meilleures performances.
Lorsque vous préparerez un environnement SAS GRID multinœud pour la mise en production, vous remarquerez peut-être une diminution répétable de 30 % du temps d’exécution faisant passer celui-ci de 8 heures à 5 heures et demi :
Option de montage | Durée d’exécution des tâches |
---|---|
Aucune nconnect |
8 heures |
nconnect=8 |
5,5 heures |
Les deux ensembles de tests ont utilisé la même machine virtuelle E32-8_v4 et RHEL 8.3, avec la valeur de lecture par anticipation définie sur 15 Mio.
Lorsque vous utilisez nconnect
, gardez les règles suivantes à l’esprit :
nconnect
est pris en charge par Azure NetApp Files sur toutes les principales distributions Linux, mais uniquement sur les versions les plus récentes :Version Linux NFSv3 (version minimale) NFSv 4.1 (version minimale) Redhat Enterprise Linux RHEL8.3 RHEL8.3 SUSE SLES12SP4 ou SLES15SP1 SLES15SP2 Ubuntu Ubuntu18.04 Remarque
SLES15SP2 est la version SUSE minimale dans laquelle
nconnect
est pris en charge par Azure NetApp Files pour NFSv4.1. Toutes les autres versions spécifiées sont les premières versions à avoir inclus la fonctionnaliténconnect
.Tous les montages effectués à partir d’un même point de terminaison héritent du paramètre
nconnect
de la première exportation montée, comme indiqué dans les scénarios suivants :Scénario 1 :
nconnect
est utilisé par le premier montage. Par conséquent, tous les montages situés sur le même point de terminaison utilisentnconnect=8
.mount 10.10.10.10:/volume1 /mnt/volume1 -o nconnect=8
mount 10.10.10.10:/volume2 /mnt/volume2
mount 10.10.10.10:/volume3 /mnt/volume3
Scénario 2 :
nconnect
n’est pas utilisé par le premier montage. Par conséquent, aucun montage situé sur le même point de terminaison n’utilisenconnect
, même sinconnect
est spécifié.mount 10.10.10.10:/volume1 /mnt/volume1
mount 10.10.10.10:/volume2 /mnt/volume2 -o nconnect=8
mount 10.10.10.10:/volume3 /mnt/volume3 -o nconnect=8
Scénario 3 : les paramètres
nconnect
ne sont pas propagés sur des points de terminaison de stockage distincts.nconnect
est utilisé par le montage provenant de10.10.10.10
, mais pas par le montage provenant de10.12.12.12
.mount 10.10.10.10:/volume1 /mnt/volume1 -o nconnect=8
mount 10.12.12.12:/volume2 /mnt/volume2
nconnect
peut être utilisé pour augmenter la concurrence de stockage à partir d’un client donné.
Pour plus d’informations, consultez Bonnes pratiques concernant la concurrence Linux pour Azure NetApp Files.
Considérations Nconnect
Il n’est pas recommandé d’utiliser les options de montage nconnect
et sec=krb5*
ensemble. La détérioration des performances a été observée lors de l’utilisation des deux options combinées.
L’interface de programmation d’applications standard de sécurité générique (GSS-API) permet aux applications de protéger les données envoyées aux applications homologues. Ces données peuvent être envoyées d’un client sur un ordinateur à un serveur sur un autre ordinateur.
Lorsque nconnect
est utilisé dans Linux, le contexte de sécurité GSS est partagé entre toutes les connexions nconnect
à un serveur particulier. TCP est un transport fiable qui prend en charge la livraison de paquets non ordonnés pour traiter les paquets non ordonnés dans un flux GSS, à l’aide d’une fenêtre glissante de numéros de séquence. Lorsque les paquets non dans la fenêtre de séquence sont reçus, le contexte de sécurité est ignoré et un nouveau contexte de sécurité est négocié. Tous les messages envoyés dans le contexte maintenant ignoré ne sont plus valides, ce qui oblige les messages à être renvoyés. Un plus grand nombre de paquets dans une configuration nconnect
provoque des paquets non dans la fenêtre fréquents, ce qui déclenche le comportement décrit. Aucun pourcentage de détérioration spécifique ne peut être indiqué avec ce comportement.
Rsize
et Wsize
Les exemples de cette section fournissent des informations sur la manière d’aborder le réglage des performances. Vous devrez peut-être apporter des ajustements pour répondre aux besoins spécifiques de votre application.
Les indicateurs rsize
et wsize
définissent la taille de transfert maximale d’une opération NFS. Si rsize
ou wsize
ne sont pas spécifiés sur le montage, le client et le serveur négocient la plus grande taille prise en charge par les deux. À l’heure actuelle, Azure NetApp Files et les distributions Linux modernes prennent en charge des tailles de lecture et d’écriture pouvant aller jusqu’à 1 048 576 octets (1 Mio). Toutefois, pour optimiser l’ensemble du débit et de la latence, Azure NetApp Files recommande de définir rsize
et wsize
sur une valeur inférieure ou égale à 262 144 octets (256 Ko). Vous pouvez constater que la latence augmente et que le débit baisse lorsque vous utilisez rsize
et wsize
avec une valeur supérieure à 256 Kio.
Par exemple, la rubrique Déployer un système Scale-out SAP HANA avec le nœud de secours sur des machines virtuelles Azure à l’aide d’Azure NetApp Files sur SUSE Linux Enterprise Server explique la valeur maximale de 256 Kio pour rsize
et wsize
de la façon suivante :
sudo vi /etc/fstab
# Add the following entries
10.23.1.5:/HN1-data-mnt00001 /hana/data/HN1/mnt00001 nfs rw,vers=4,minorversion=1,hard,timeo=600,rsize=262144,wsize=262144,noatime,_netdev,sec=sys 0 0
10.23.1.6:/HN1-data-mnt00002 /hana/data/HN1/mnt00002 nfs rw,vers=4,minorversion=1,hard,timeo=600,rsize=262144,wsize=262144,noatime,_netdev,sec=sys 0 0
10.23.1.4:/HN1-log-mnt00001 /hana/log/HN1/mnt00001 nfs rw,vers=4,minorversion=1,hard,timeo=600,rsize=262144,wsize=262144,noatime,_netdev,sec=sys 0 0
10.23.1.6:/HN1-log-mnt00002 /hana/log/HN1/mnt00002 nfs rw,vers=4,minorversion=1,hard,timeo=600,rsize=262144,wsize=262144,noatime,_netdev,sec=sys 0 0
10.23.1.4:/HN1-shared/shared /hana/shared nfs rw,vers=4,minorversion=1,hard,timeo=600,rsize=262144,wsize=262144,noatime,_netdev,sec=sys 0 0
Par exemple, SAS Viya recommande une taille de lecture et d’écriture de 256 Kio, et SAS GRID limite r/wsize
à 64 Kio, tout en augmentant les performances de lecture grâce à l’augmentation de la lecture par anticipation pour les montages NFS. Pour plus d’informations, consultez Meilleures pratiques en matière de lecture anticipée NFS pour Azure NetApp Files.
Les remarques suivantes s’appliquent à l’utilisation de rsize
et de wsize
:
- La taille des opérations d’E/S aléatoires sont souvent inférieures à celles des options de montage
rsize
etwsize
. Par conséquent, il ne s’agit pas de contraintes. - Lorsque vous utilisez le cache du système de fichiers, les E/S séquentielles ont la taille prévue par les options de montage
rsize
etwsize
, sauf si la taille du fichier est inférieure àrsize
et àwsize
. - Les opérations qui contournent le cache du système de fichiers, même si elles sont toujours limitées par les options de montage
rsize
etwsize
, n’ont pas la taille maximale spécifiée parrsize
ouwsize
. Ceci est important lorsque vous utilisez des générateurs de charges de travail qui ont l’optiondirectio
.
Avec Azure NetApp Files, pour optimiser l’ensemble du débit et de la latence, il est recommandé de définir rsize
et wsize
sur une valeur inférieure ou égale à 262 144 octets.
Cohérence de bout en bout et minuteurs d’attribut de cache
NFS utilise un modèle de cohérence approximative. La cohérence est approximative, car l’application n’a pas à accéder au stockage partagé pour récupérer les données à chaque fois qu’elle en a besoin, ce qui aurait un impact considérable sur les performances de l’application. Il existe deux mécanismes qui gèrent ce processus : les minuteurs d’attribut de cache et la cohérence de bout en bout.
Si le client est entièrement propriétaire des données, c’est-à-dire que celles-ci ne sont pas partagées entre plusieurs nœuds ou systèmes, la cohérence est garantie. Dans ce cas, vous pouvez réduire les opérations d’accès au stockage getattr
pour accélérer l’application en désactivant la cohérence de bout en bout (cto
) (avec nocto
comme option de montage) et en rallongeant les délais d’expiration pour la gestion du cache d’attributs (actimeo=600
comme option de montage remplace la valeur par défaut du minuteur (acregmin=3,acregmax=30,acdirmin=30,acdirmax=60
) par 10m). Dans certains tests, nocto
réduit les appels d’accès getattr
d’environ 65 à 70 %, et l’ajustement de actimeo
réduit les appels de 20 à 25 % supplémentaires.
Fonctionnement des minuteurs du cache d’attributs
Les attributs acregmin
, acregmax
, acdirmin
et acdirmax
contrôlent la cohérence du cache. Les deux premiers attributs contrôlent la durée d’approbation des attributs des fichiers. Les deux derniers attributs contrôlent la durée d’approbation des attributs du fichier d’annuaire (taille du répertoire, propriété du répertoire, autorisations du répertoire). Les attributs min
et max
définissent la durée minimale et la durée maximale pendant lesquelles les attributs d’un répertoire, les attributs d’un fichier ou le contenu du cache d’un fichier sont considérés comme approuvés. Entre min
et max
, un algorithme est utilisé pour définir la durée pendant laquelle une entrée mise en cache est approuvée.
Prenons par exemple les valeurs par défaut de acregmin
et de acregmax
qui sont de 3 et 30 secondes, respectivement. Par exemple, les attributs sont évalués plusieurs fois pour les fichiers d’un répertoire. Au bout de 3 secondes, le service NFS est interrogé à des fins d’actualisation. Si les attributs sont considérés comme valides, le client double la durée d’approbation : 6 secondes, 12 secondes, 24 secondes, puis 30 secondes (30 étant la valeur maximale). À partir de là, et jusqu’à ce que les attributs mis en cache soient considérés comme obsolètes (ce qui correspondra au début d’un nouveau cycle), l’approbation est définie sur 30 secondes (valeur spécifiée par acregmax
).
Il existe d’autres cas pouvant bénéficier d’un ensemble similaire d’options de montage, même si les clients ne sont pas entièrement propriétaires. C’est le cas, par exemple, quand les clients utilisent des données en lecture seule et quand la mise à jour des données est gérée autrement. Pour les applications qui utilisent des grilles de clients comme EDA, l’hébergement web et l’affichage de films, et qui ont des jeux de données relativement statiques (outils ou bibliothèques EDA, contenu web, données de texture), en général, le jeu de données est en grande partie mis en cache sur les clients. Il y a très peu de lectures et aucune écriture. Un grand nombre d’appels getattr
/access reviennent au stockage. Ces jeux de données sont généralement mis à jour par le biais d’un autre client qui monte les systèmes de fichiers et envoie (push) régulièrement des mises à jour de contenu.
Dans ces cas-là, il existe un retard de sélection du nouveau contenu, ce qui fait que l’application fonctionne avec des données potentiellement obsolètes. nocto
et actimeo
peuvent alors être utilisés pour contrôler la période durant laquelle les données obsolètes peuvent être gérées. Par exemple, dans les outils et les bibliothèques EDA, actimeo=600
fonctionne bien, car en général, ces données ne sont pas mises à jour fréquemment. Pour les petits hébergements web où les clients ont besoin de voir les mises à jour de leurs données en temps opportun lorsqu’ils modifient leurs sites, actimeo=10
peut être acceptable. Pour les sites web à grande échelle où le contenu est envoyé (push) vers plusieurs systèmes de fichiers, actimeo=60
peut être acceptable.
Dans ces cas-là, l’utilisation de ces options de montage réduit considérablement la charge de travail dans le stockage. Par exemple, une expérience EDA récente a réduit le nombre d’E/S par seconde du volume d’outil, permettant de passer de >150 K à ~6 K. Les applications peuvent s’exécuter beaucoup plus rapidement, car elles peuvent faire confiance aux données en mémoire. Le temps d’accès à la mémoire s’exprime en nanosecondes, par rapport aux centaines de microsecondes nécessaires pour getattr
/access sur un réseau rapide.
Cohérence de bout en bout
La cohérence de bout en bout (option de montage cto
) garantit que, quel que soit l’état du cache, lors de l’ouverture, les données les plus récentes d’un fichier seront toujours présentées à l’application.
- Lorsqu’un répertoire est analysé (
ls
,ls -l
par exemple), un certain ensemble d’appels RPS (appel de procédure distante) sont émis. Le serveur NFS partage sa vue du système de fichiers. Tant quecto
est utilisé par tous les clients NFS accédant à une exportation NFS donnée, tous les clients voient la même liste de fichiers et de répertoires. L’actualisation des attributs des fichiers dans le répertoire est contrôlée par les minuteurs du cache d’attributs. En d’autres termes, tant quecto
est utilisé, les fichiers s’affichent pour les clients distants dès que le fichier est créé et qu’il arrive dans le stockage. - Lorsqu’un fichier est ouvert, son contenu est garanti à jour du point de vue du serveur NFS.
S’il existe une condition de concurrence dans laquelle le contenu n’a pas terminé le vidage de la machine 1 lorsqu’un fichier est ouvert sur la machine 2, la machine 2 reçoit uniquement les données présentes sur le serveur au moment de l’ouverture. Dans ce cas, la machine 2 ne récupère pas plus de données à partir du fichier tant que la valeur du minuteur
acreg
n’est pas atteinte. Une fois cette valeur atteinte, la machine 2 vérifie à nouveau la cohérence de cache à partir du serveur. Vous pouvez observer ce scénario à l’aide d’un-f
de fin à partir de la machine 2 pendant que le fichier est encore en cours d’écriture à partir de la machine 1.
Aucune cohérence de bout en bout
Lorsqu’aucune cohérence de bout en bout (nocto
) n’est utilisée, le client approuve l’actualisation de sa vue actuelle du fichier et du répertoire jusqu’à ce que la valeur des minuteurs d’attribut de cache soient atteintes.
Lorsqu’un répertoire est analysé (
ls
,ls -l
par exemple), un certain ensemble d’appels RPS (appel de procédure distante) sont émis. Le client n’émet qu’un seul appel au serveur pour obtenir la liste actuelle des fichiers lorsque la valeur du minuteur du cacheacdir
est atteinte. Dans ce cas, les fichiers et répertoires récemment créés n’apparaissent pas. Les fichiers et répertoires récemment supprimés s’affichent.Lorsqu’un fichier est ouvert, tant qu’il se trouve toujours dans le cache, son contenu mis en cache (s’il y en a) est retourné sans validation de la cohérence avec le serveur NFS.
Étapes suivantes
- Bonnes pratiques d’E/S directes Linux pour Azure NetApp Files
- Meilleures pratiques en matière de cache de système de fichiers Linux pour Azure NetApp Files
- Bonnes pratiques concernant la concurrence Linux pour Azure NetApp Files
- Meilleures pratiques à lire à l’avance pour NFS Linux
- Meilleures pratiques pour les références SKU de machine virtuelle Azure
- Test d’évaluation des performances pour Linux