Avec l’essor rapide des applications d’IA, mené par des modèles comme ChatGPT, la demande de puissance de calcul est montée en flèche. Pour répondre aux demandes informatiques croissantes de l'ère de l'IA, le groupe H3C, sous l'égide de Tsinghua Unigroup, a récemment dévoilé 11 nouveaux produits des séries H3C UniServer G6 et HPE Gen11 lors du NAVIGATE Leader Summit 2023. Ces nouveaux produits serveur créent une matrice complète pour l'IA dans divers scénarios, fournissant une plate-forme sous-jacente puissante pour gérer des données massives et des algorithmes de modèle, et garantissant un approvisionnement suffisant en ressources informatiques pour l'IA.
Matrice de produits diversifiée pour répondre aux besoins informatiques variés de l'IA
En tant que leader de l’informatique intelligente, le Groupe H3C est profondément engagé dans le domaine de l’IA depuis de nombreuses années. En 2022, H3C a atteint le taux de croissance le plus élevé sur le marché chinois de l'informatique accélérée et a accumulé un total de 132 premiers classements mondiaux dans le référentiel d'IA de renommée internationale MLPerf, démontrant sa solide expertise et ses capacités techniques.
S'appuyant sur une architecture informatique avancée et des capacités de gestion intelligente de la puissance de calcul fondées sur l'informatique intelligente, H3C a développé le produit phare de l'informatique intelligente, le H3C UniServer R5500 G6, spécialement conçu pour la formation de modèles à grande échelle. Ils ont également présenté le H3C UniServer R5300 G6, un moteur informatique hybride adapté aux scénarios d'inférence/formation à grande échelle. Ces produits répondent en outre aux diverses exigences informatiques dans différents scénarios d'IA, offrant une couverture informatique complète de l'IA.
Produit phare de l'informatique intelligente conçu pour la formation de modèles à grande échelle
Le H3C UniServer R5500 G6 allie robustesse, faible consommation d'énergie et intelligence. Par rapport à la génération précédente, il offre une puissance de calcul trois fois supérieure, réduisant ainsi le temps de formation de 70 % pour les scénarios de formation de modèles à grande échelle GPT-4. Il s'applique à divers scénarios commerciaux d'IA, tels que la formation à grande échelle, la reconnaissance vocale, la classification d'images et la traduction automatique.
Points forts : Le R5500 G6 prend en charge jusqu'à 96 cœurs de processeur, offrant une augmentation de 150 % des performances des cœurs. Il est équipé du nouveau module NVIDIA HGX H800 8-GPU, fournissant 32 PFLOPS de puissance de calcul, ce qui se traduit par une amélioration de 9 fois de la vitesse de formation de l'IA des modèles à grande échelle et une amélioration de 30 fois des performances d'inférence de l'IA des modèles à grande échelle. De plus, grâce à la prise en charge des réseaux PCIe 5.0 et 400G, les utilisateurs peuvent déployer des clusters informatiques d'IA plus performants, accélérant ainsi l'adoption et l'application de l'IA dans les entreprises.
Intelligence : le R5500 G6 prend en charge deux configurations de topologie, s'adaptant intelligemment à divers scénarios d'application d'IA et accélérant les applications d'apprentissage profond et de calcul scientifique, améliorant considérablement l'utilisation des ressources GPU. Grâce à la fonctionnalité GPU multi-instance du module H800, un seul H800 peut être divisé en 7 instances GPU, avec la possibilité d'avoir jusqu'à 56 instances GPU, chacune disposant de ressources de calcul et de mémoire indépendantes. Cela améliore considérablement la flexibilité des ressources de l’IA.
Faible empreinte carbone : Le R5500 G6 prend entièrement en charge le refroidissement liquide, y compris le refroidissement liquide pour le CPU et le GPU. Avec un PUE (Power Usage Effectiveness) inférieur à 1,1, il permet une « informatique cool » dans le feu de l’essor informatique.
Il convient de mentionner que le R5500 G6 a été reconnu comme l'un des « 10 meilleurs serveurs hautes performances exceptionnels de 2023 » dans le « Classement de puissance 2023 pour les performances informatiques » lors de sa sortie.
Moteur informatique hybride pour une adaptation flexible des demandes de formation et d'inférence
Le H3C UniServer R5300 G6, en tant que serveur IA de nouvelle génération, offre des améliorations significatives en termes de spécifications CPU et GPU par rapport à son prédécesseur. Il offre des performances exceptionnelles, une topologie intelligente et des capacités de calcul et de stockage intégrées, ce qui le rend adapté à la formation de modèles d'apprentissage profond, à l'inférence d'apprentissage profond et à d'autres scénarios d'application d'IA, répondant de manière flexible aux besoins de formation et de calcul d'inférence.
Performances exceptionnelles : le R5300 G6 est compatible avec la dernière génération de GPU NVIDIA de qualité entreprise, offrant une amélioration des performances de 4,85 fois par rapport à la génération précédente. Il prend en charge différents types de cartes d'accélération de l'IA, telles que les GPU, les DPU et les NPU, pour répondre aux exigences hétérogènes de puissance de calcul de l'IA dans différents scénarios, renforçant ainsi l'ère de l'intelligence.
Topologie intelligente : le R5300 G6 propose cinq paramètres de topologie GPU, notamment HPC, IA parallèle, IA série, accès direct à 4 cartes et accès direct à 8 cartes. Cette flexibilité sans précédent améliore considérablement l'adaptabilité aux différents scénarios d'application utilisateur, alloue intelligemment les ressources et permet un fonctionnement efficace de la puissance de calcul.
Informatique et stockage intégrés : le R5300 G6 s'adapte de manière flexible aux cartes d'accélération IA et aux cartes réseau intelligentes, combinant des capacités de formation et d'inférence. Il prend en charge jusqu'à 10 GPU double largeur et 24 emplacements pour disque dur LFF (Large Form Factor), permettant une formation et une inférence simultanées sur un seul serveur et fournissant un moteur informatique rentable pour les environnements de développement et de test. Avec une capacité de stockage allant jusqu'à 400 To, il répond pleinement aux besoins d'espace de stockage des données d'IA.
Avec le boom de l’IA, la puissance de calcul est constamment remodelée et remise en question. La sortie des serveurs IA de nouvelle génération marque une nouvelle étape dans l'engagement du Groupe H3C en faveur de la technologie « d'intelligence inhérente » et dans sa volonté continue d'évolution de l'informatique intelligente.
Tourné vers l’avenir, guidé par la stratégie « Cloud-Native Intelligence », le Groupe H3C adhère au concept de « pragmatisme méticuleux, dotant l’époque d’intelligence ». Ils continueront à cultiver le sol fertile de l’informatique intelligente, à explorer des scénarios d’application approfondis de l’IA et à accélérer l’arrivée d’un monde intelligent doté d’une puissance de calcul adaptable et prête pour l’avenir.
Heure de publication : 04 juillet 2023