En général, les disques ou les baies de disques offrent les meilleures performances dans un scénario de connexion à un seul hôte. La plupart des systèmes d'exploitation sont basés sur des systèmes de fichiers exclusifs, ce qui signifie qu'un système de fichiers ne peut appartenir qu'à un seul système d'exploitation. En conséquence, le système d'exploitation et le logiciel d'application optimisent la lecture et l'écriture des données pour le système de stockage sur disque en fonction de ses caractéristiques. Cette optimisation vise à réduire les temps de recherche physique et à diminuer les temps de réponse mécaniques des disques. Les demandes de données de chaque processus de programme sont traitées par le système d'exploitation, ce qui entraîne des demandes de lecture et d'écriture de données optimisées et ordonnées pour le disque ou la baie de disques. Cela conduit aux meilleures performances du système de stockage dans cette configuration.
Pour les baies de disques, bien qu'un contrôleur RAID supplémentaire soit ajouté entre le système d'exploitation et les disques individuels, les contrôleurs RAID actuels gèrent et vérifient principalement les opérations de tolérance aux pannes de disque. Ils n’effectuent pas de fusion, de réorganisation ou d’optimisation des demandes de données. Les contrôleurs RAID sont conçus sur la base de l'hypothèse que les demandes de données proviennent d'un seul hôte, déjà optimisé et trié par le système d'exploitation. Le cache du contrôleur fournit uniquement des capacités de mise en mémoire tampon directe et informatique, sans mettre les données en file d'attente pour l'optimisation. Lorsque le cache est rapidement rempli, la vitesse diminue immédiatement pour atteindre la vitesse réelle des opérations sur le disque.
La fonction principale du contrôleur RAID est de créer un ou plusieurs grands disques tolérants aux pannes à partir de plusieurs disques et d'améliorer la vitesse globale de lecture et d'écriture des données à l'aide de la fonction de mise en cache sur chaque disque. Le cache de lecture des contrôleurs RAID améliore considérablement les performances de lecture de la matrice de disques lorsque les mêmes données sont lues dans un court laps de temps. La vitesse maximale réelle de lecture et d'écriture de l'ensemble de la baie de disques est limitée par la valeur la plus faible parmi la bande passante du canal hôte, les capacités de calcul de vérification et de contrôle du système du processeur du contrôleur (moteur RAID), la bande passante du canal de disque et les performances du disque (les performances réelles combinées de tous les disques). De plus, une inadéquation entre la base d'optimisation des requêtes de données du système d'exploitation et le format RAID, telle que la taille de bloc des requêtes d'E/S ne correspondant pas à la taille du segment RAID, peut avoir un impact significatif sur les performances de la matrice de disques.
Variations de performances des systèmes de stockage sur matrice de disques traditionnels dans l'accès à plusieurs hôtes
Dans les scénarios d'accès à plusieurs hôtes, les performances des baies de disques diminuent par rapport aux connexions à un seul hôte. Dans les systèmes de stockage de baies de disques à petite échelle, qui disposent généralement d'une paire unique ou redondante de contrôleurs de baies de disques et d'un nombre limité de disques connectés, les performances sont affectées par les flux de données désordonnés provenant de divers hôtes. Cela entraîne une augmentation des temps de recherche sur le disque, des informations d'en-tête et de fin des segments de données et une fragmentation des données pour les processus de lecture, de fusion, de vérification et de réécriture. Par conséquent, les performances de stockage diminuent à mesure que davantage d’hôtes sont connectés.
Dans les systèmes de stockage sur baies de disques à grande échelle, la dégradation des performances est différente de celle des baies de disques à petite échelle. Ces systèmes à grande échelle utilisent une structure de bus ou une structure de commutation à points de croisement pour connecter plusieurs sous-systèmes de stockage (matrices de disques) et incluent des caches de grande capacité et des modules de connexion hôte (similaires aux concentrateurs de canaux ou aux commutateurs) pour plus d'hôtes dans le bus ou la commutation. structure. Les performances dépendent largement du cache dans les applications de traitement de transactions, mais ont une efficacité limitée dans les scénarios de données multimédia. Bien que les sous-systèmes de matrice de disques internes de ces systèmes à grande échelle fonctionnent de manière relativement indépendante, une seule unité logique n'est construite qu'au sein d'un seul sous-système de disque. Ainsi, les performances d'une seule unité logique restent faibles.
En conclusion, les baies de disques à petite échelle subissent une baisse de performances en raison de flux de données désordonnés, tandis que les baies de disques à grande échelle comportant plusieurs sous-systèmes de baies de disques indépendants peuvent prendre en charge davantage d'hôtes mais sont toujours confrontées à des limitations pour les applications de données multimédia. D'autre part, les systèmes de stockage NAS basés sur la technologie RAID traditionnelle et utilisant les protocoles NFS et CIFS pour partager le stockage avec des utilisateurs externes via des connexions Ethernet subissent moins de dégradation des performances dans les environnements d'accès à plusieurs hôtes. Les systèmes de stockage NAS optimisent la transmission des données à l'aide de plusieurs transferts TCP/IP parallèles, permettant une vitesse partagée maximale d'environ 60 Mo/s dans un seul système de stockage NAS. L'utilisation de connexions Ethernet permet aux données d'être écrites de manière optimale sur le système de disques après gestion et réorganisation par le système d'exploitation ou le logiciel de gestion des données dans le serveur léger. Par conséquent, le système de disques lui-même ne subit pas de dégradation significative des performances, ce qui rend le stockage NAS adapté aux applications nécessitant le partage de données.
Heure de publication : 17 juillet 2023