L'essor de l'IA donne naissance au « GPU-as-a-Service », une solution face à la pénurie de puissance mais non sans limites,

Avec des risques de dépendance aux géants du cloud

Le 21 janvier 2025 à 18:07, par Bruno

247PARTAGES

Le secteur de l'IA connaît une demande croissante en puissance de calcul, notamment pour alimenter des modèles d'apprentissage profond toujours plus sophistiqués. Cependant, face à des besoins de plus en plus importants et à des coûts d'infrastructure élevés, de nombreuses startups se tournent vers des solutions comme le « GPU-as-a-Service » (GPUaaS). Ce modèle économique permet de mutualiser la capacité de calcul inutilisée, offrant ainsi aux entreprises l'opportunité de louer des ressources GPU sans avoir à investir dans une infrastructure coûteuse. Bien que les GPU ne soient pas les seules options pour le traitement des modèles d'IA, leur capacité à gérer des opérations parallèles les rend indispensables, surtout dans un contexte où la puissance de calcul nécessaire pour entraîner des modèles d'IA est devenue un obstacle majeur.

Les entreprises spécialisées dans le GPUaaS, comme Kinesis, Hyperbolic ou Runpod, exploitent des ressources sous-utilisées dans les serveurs du monde entier, permettant aux entreprises d'accéder à une capacité de calcul à la demande, tout en réduisant les coûts d'exploitation. Ce modèle présente également des avantages environnementaux, car il optimise l'utilisation des ressources existantes plutôt que de construire de nouveaux serveurs, contribuant ainsi à une réduction de la consommation d'énergie.

Des études ont montré que plus de la moitié des GPU existants ne sont pas utilisés à un moment donné. Qu'il s'agisse d'ordinateurs personnels ou de fermes de serveurs colossales, une grande partie de la capacité de traitement est sous-utilisée. Kinesis identifie les capacités de calcul inutilisées - tant pour les GPU que pour les CPU - dans les serveurs du monde entier et les compile en une source de calcul unique que les entreprises peuvent utiliser. Kinesis s'associe à des universités, des centres de données, des entreprises et des particuliers qui souhaitent vendre leur puissance de calcul inutilisée. Grâce à un logiciel spécial installé sur leurs serveurs, Kinesis détecte les unités de traitement inutilisées, les prépare et les propose à ses clients pour une utilisation temporaire.

Envoyé par ACM Digital Library

Le « Deep learning » joue un rôle essentiel dans de nombreuses applications logicielles intelligentes. Les développeurs d'entreprise soumettent et exécutent des tâches d'apprentissage profond sur des plateformes partagées et multi-locataires afin d'entraîner et de tester efficacement les modèles. Ces plateformes sont généralement équipées d'un grand nombre de processeurs graphiques (GPU) pour accélérer les calculs d'apprentissage profond.

Cependant, certains travaux présentent une utilisation plutôt faible des GPU alloués, ce qui entraîne un gaspillage substantiel des ressources et une réduction de la productivité du développement. Cet article présente une étude empirique complète sur la faible utilisation des GPU dans les travaux d'apprentissage profond, basée sur 400 travaux réels (avec une utilisation moyenne des GPU de 50 % ou moins) collectés à partir de la plateforme interne d'apprentissage profond de Microsoft. Nous avons découvert 706 problèmes de faible utilisation du GPU grâce à un examen méticuleux des métadonnées des tâches, des journaux d'exécution, des métriques d'exécution, des scripts et des programmes. En outre, nous identifions les causes profondes communes et proposons des correctifs correspondants.

Nos principales conclusions sont les suivantes :

la faible utilisation du GPU par les tâches d'apprentissage profond est due à des calculs GPU insuffisants et à des interruptions causées par des tâches non GPU ;
environ la moitié (46,03 %) des problèmes sont attribués aux opérations de données ;
45,18 % des problèmes sont liés aux modèles d'apprentissage profond et se manifestent pendant les phases d'apprentissage et d'évaluation des modèles ;
la plupart (84,99 %) des problèmes de faible utilisation du GPU peuvent être résolus avec un petit nombre de modifications du code/des scripts. Sur la base des résultats de l'étude, nous proposons des orientations de recherche potentielles.

Cependant, l'essor de ces services soulève des questions sur la rentabilité à long terme et sur la dépendance accrue des entreprises vis-à-vis de ces solutions externes. Bien que l'infrastructure GPUaaS semble offrir une réponse temporaire à la demande croissante en calcul pour l'IA, elle n'élimine pas les défis sous-jacents liés à la gestion de la puissance de calcul et à la durabilité de ces services. De plus, l'inévitabilité de l'optimisation des modèles d'IA, avec une gestion plus fine de l'énergie et des données, pourrait redéfinir le paysage de cette industrie en plein boom.

Le GPUaaS face aux défis environnementaux de l’IA

À travers le monde, les entreprises se battent pour répondre aux besoins en GPU nécessaires au fonctionnement de modèles d'IA de plus en plus complexes. Bien que les GPU ne soient pas l'unique option pour faire tourner un modèle d'IA, ils sont devenus la solution privilégiée en raison de leur capacité à exécuter plusieurs opérations simultanément, une caractéristique clé pour les modèles d'apprentissage profond. Cependant, toutes les startups en IA n'ont pas les ressources nécessaires pour investir dans la grande quantité de GPU requise pour soutenir des modèles de pointe. Pour certaines, externaliser cette tâche s'avère plus avantageux.

Alors que les géants technologiques comme Amazon ou Microsoft possèdent leur propre infrastructure cloud, de petites entreprises comme Kinesis ont mis au point des solutions permettant d'exploiter au mieux les espaces de calcul inutilisés. « Les entreprises ont besoin de puissance de calcul pour entraîner leurs modèles ou exécuter leurs applications, mais elles n'ont pas nécessairement besoin de posséder ou de gérer des serveurs », explique Bina Khimani, cofondatrice de Kinesis.

Des études ont révélé que plus de la moitié des GPU disponibles sont inutilisés à un moment donné. Que ce soit dans les ordinateurs personnels ou dans les fermes de serveurs, une grande partie de la capacité de traitement reste sous-exploitée. Kinesis identifie ces capacités de calcul inutilisées – tant pour les GPU que pour les CPU – dans les serveurs du monde entier et les agrège en une source unique de puissance de calcul que les entreprises peuvent utiliser.

Kinesis collabore avec des universités, des centres de données, des entreprises et des particuliers souhaitant vendre leur puissance de calcul inutilisée. Grâce à un logiciel spécialisé installé sur leurs serveurs, Kinesis détecte, prépare et met cette capacité à la disposition de ses clients pour une utilisation temporaire. « Nous avons développé une technologie permettant de regrouper la puissance de calcul fragmentée et inactive, puis de la rediriger vers une plateforme informatique sans serveur et autogérée », explique Khimani. Les clients peuvent même choisir l'emplacement de leurs GPU ou CPU.

À mesure que les modèles d'apprentissage deviennent plus avancés, ils nécessitent plus de puissance et une infrastructure capable de traiter les données de plus en plus rapidement. En d'autres termes, sans une quantité suffisante de GPU, les grands modèles d'IA ne peuvent ni fonctionner ni progresser. En octobre, Sam Altman, PDG d'OpenAI, a reconnu que l'entreprise ne lançait pas de nouveaux produits aussi fréquemment qu'elle l'aurait souhaité en raison des « nombreuses limitations » liées à la capacité de calcul. En octobre également, Amy Woods, directrice financière de Microsoft, a indiqué que la demande en IA « reste plus élevée » que la « capacité disponible ».

L'un des principaux avantages du GPUaaS réside dans son efficacité économique. En éliminant la nécessité d'acheter et de maintenir une infrastructure physique, il permet aux entreprises de se concentrer sur l'amélioration de leurs propres modèles d'IA sans avoir à investir dans des serveurs et des infrastructures informatiques. Les clients peuvent ainsi payer uniquement pour la quantité exacte de GPU qu'ils utilisent, réduisant ainsi les coûts liés aux périodes d'inactivité de leurs propres serveurs. Les startups sans serveur, comme Kinesis, affirment également être plus écologiques que les entreprises de cloud computing traditionnelles. En exploitant les unités de traitement existantes et inutilisées au lieu d'ajouter de nouveaux serveurs, elles prétendent réduire significativement la consommation d'énergie.

Au cours des cinq dernières années, les émissions de carbone des grandes entreprises technologiques, telles que Google et Microsoft, ont considérablement augmenté en raison de la consommation énergétique liée à l'IA. En réponse, certaines ont opté pour l'énergie nucléaire afin d'alimenter leurs serveurs de manière durable. Kinesis et d'autres startups proposent une alternative dans laquelle aucun nouveau serveur n'est nécessaire.

GPUaaS : une solution flexible, mais à quel prix économique et stratégique ?

Le modèle GPUaaS n’est pas exempt de limites. D’un point...

La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :

Identifiez-vous

Créer un compte

L'essor de l'IA donne naissance au « GPU-as-a-Service », une solution face à la pénurie de puissance mais non sans limites,

Avec des risques de dépendance aux géants du cloud

Identifiant
Mot de passe

Mot de passe oublié ?

Identifiez-vous

Créer un compte

L'essor de l'IA donne naissance au « GPU-as-a-Service », une solution face à la pénurie de puissance mais non sans limites, Avec des risques de dépendance aux géants du cloud

L'essor de l'IA donne naissance au « GPU-as-a-Service », une solution face à la pénurie de puissance mais non sans limites,

Avec des risques de dépendance aux géants du cloud