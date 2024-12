Vers des solutions innovantes pour réduire la densité

Refroidissement, bande passante et énergie : les nouveaux combats des centres de données

Les centres de données se dirigent vers des systèmes toujours plus compacts et énergivores. Les racks de 19 pouces atteignent désormais des puissances supérieures à 120 kilowatts dans les configurations haute densité, nécessitant souvent un refroidissement liquide direct pour dissiper la chaleur. Cette tendance est en grande partie liée à l'augmentation des modèles d'intelligence artificielle (IA), dont les paramètres sont multipliés par 32 environ tous les trois ans, selon des chercheurs de Fujitsu. Pour répondre à ces besoins, des fabricants comme Nvidia développent des interconnexions ultrarapides, capables de transferts à 1,8 téraoctet par seconde, permettant à plusieurs GPU de fonctionner comme une seule unité.Cependant, ces vitesses ont une limite physique : les câbles en cuivre ne peuvent maintenir un signal que sur une courte distance, de 1 à 2 mètres. Une alternative consiste à utiliser des connexions optiques, qui permettent de transmettre les données sur de plus longues distances. Bien que déjà utilisées dans certaines infrastructures de centre de données, les optiques enfichables actuelles manquent d'efficacité et de rapidité.En 2024, lors de la conférence GTC, Jensen Huang, PDG de Nvidia, a précisé que l’utilisation de l’optique pour assembler les 72 GPU de leurs racks NVL72 aurait augmenté leur consommation énergétique de 20 kilowatts. Faut-il en conclure que les racks plus denses sont une fatalité ? Pas nécessairement, selon Ayar Labs. L’entreprise affirme que l’intégration directe de l’optique dans les processeurs ou GPU pourrait réduire les goulets d’étranglement de la bande passante tout en diminuant la densité nécessaire par rack.Ayar Labs travaille depuis 2015 sur un chiplet d’interconnexion optique destiné à être intégré avec des processeurs ou des GPU. Cette technologie permet d’étendre la bande passante et la portée des connexions bien au-delà des limites du cuivre. Dans le cadre de l'apprentissage et de l'inférence à grande échelle, ces fibres optiques pourraient remplacer des solutions existantes comme le NVLink de Nvidia ou l'Infinity Fabric d'AMD.Selon Terry Thorn, vice-président des opérations commerciales d'Ayar Labs, l’optique intégrée offre des perspectives inédites. Elle permettrait d’étendre les capacités de calcul sur plusieurs racks tout en diminuant les contraintes thermiques et énergétiques liées à la concentration d'accélérateurs dans un seul rack. En étalant la consommation énergétique et en augmentant la surface utilisable, les opérateurs de centres de données pourraient concevoir des architectures mieux adaptées aux infrastructures IA.Malgré son potentiel, la photonique au silicium fait face à plusieurs obstacles avant son adoption à grande échelle. Il s’agit notamment d’atteindre des performances comparables à celles des interconnexions en cuivre tout en garantissant la fiabilité et la compatibilité avec les systèmes actuels. Ayar Labs travaille déjà sur des tests pour identifier les puces défectueuses avant leur intégration et propose des solutions comme la séparation des sources lumineuses des processeurs pour limiter les risques de panne.En collaboration avec Fujitsu, Ayar Labs développe des puces capables de gérer une bande passante bidirectionnelle de 8 Tbps. Ces prototypes montrent qu’il est possible de réduire la densité énergétique des racks sans compromettre leurs performances. À terme, la photonique pourrait non seulement révolutionner la conception des centres de données, mais aussi permettre des architectures plus efficaces et évolutives pour répondre aux besoins croissants de l’intelligence artificielle.L’évolution des centres de données pour répondre aux exigences croissantes de l’intelligence artificielle soulève des enjeux complexes à la croisée des avancées technologiques, des limites physiques et des inspirations biologiques. L'augmentation de la densité des racks et des besoins en refroidissement montre les défis associés à une infrastructure basée sur des câbles en cuivre, limités par leur portée et leurs capacités thermiques. Bien que les solutions optiques promettent une plus grande efficacité à long terme, leur adoption actuelle est freinée par des contraintes énergétiques et technologiques.La stratégie d’Ayar Labs, qui intègre directement l’optique dans les CPU ou GPU, représente une avancée significative, offrant une meilleure bande passante et une possibilité de dédensification des centres de données. Cependant, cette approche nécessite une transformation profonde des architectures actuelles, un défi qui rappelle les tentatives historiques de répliquer la biologie humaine, comme le cerveau, dans des systèmes mécaniques ou électroniques.Les parallèles entre le cerveau humain et l’IA soulignent une divergence fondamentale. Alors que le cerveau fonctionne avec des connexions lentes mais hautement optimisées et interdépendantes, les systèmes d’IA reposent sur la vitesse brute et des interconnexions massives. Cela pose la question de savoir si imiter la biologie est réellement le chemin optimal, ou si une approche entièrement différente, mieux adaptée aux capacités des technologies modernes, serait plus judicieuse.Enfin, la recherche sur des alternatives, comme l’utilisation de la photonique, nécessite de surmonter non seulement des limitations matérielles mais aussi des paradigmes conceptuels. Tout comme l’aviation a abandonné l’idée de reproduire le battement d’ailes pour voler, l’avenir de l’IA pourrait dépendre de la capacité à concevoir des systèmes adaptés à leurs propres contraintes et potentiels, plutôt qu'à ceux de la biologie humaine.En résumé, la transition vers une infrastructure optimisée pour l'IA repose sur un équilibre délicat entre innovation technologique, contraintes énergétiques et réflexion sur ce que l'on veut réellement accomplir avec ces systèmes. L'optique intégrée semble être une étape prometteuse, mais non sans défis majeurs à relever.Source : Ayar LabsQuel est votre avis sur le sujet ?Les puces photoniques d'Ayar Labs seront-elles suffisamment fiables et matures pour être déployées à grande échelle dans les centres de données ?Dans quelle mesure les solutions optiques actuelles, bien qu'innovantes, pourront-elles répondre aux exigences croissantes de bande passante sans causer de nouveaux problèmes thermiques ou énergétiques ?