IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Amazon Elastic Compute Cloud (EC2) : un nouveau service AWS qui permet aux clients de louer des GPU NVIDIA pour des projets d'IA rapides
Et d'accéder à des instances de GPU NVIDIA H100 Tensor Core

Le , par Anthony

10PARTAGES

5  0 
De plus en plus d'entreprises utilisent de grands modèles de langage, qui nécessitent l'accès à des GPU. Les plus populaires d'entre eux sont de loin ceux de NVIDIA, ce qui les rend coûteux et souvent peu disponibles. Louer une instance à long terme auprès d'un fournisseur de services cloud alors que vous n'avez besoin d'accéder à ces ressources coûteuses que pour une seule tâche n'est pas forcément judicieux. Pour résoudre ce problème, AWS a lancé aujourd'hui Amazon Elastic Compute Cloud (EC2) Capacity Blocks for ML, qui permet aux clients d'acheter l'accès à ces GPU pour une durée définie, généralement pour exécuter une tâche liée à l'IA telle que l'entraînement d'un modèle d'apprentissage automatique ou l'exécution d'une expérience avec un modèle existant.

Le produit permet aux clients d'accéder à des instances de GPU NVIDIA H100 Tensor Core dans des clusters d'une à 64 instances avec 8 GPU par instance. Ils peuvent réserver du temps jusqu'à 14 jours par incréments d'un jour, jusqu'à 8 semaines à l'avance. Une fois le délai écoulé, les instances s'arrêtent automatiquement. Le nouveau produit permet aux utilisateurs de s'inscrire pour le nombre d'instances dont ils ont besoin pour un bloc de temps défini, tout comme la réservation d'une chambre d'hôtel pour un certain nombre de jours (selon les termes de l'entreprise). Du point de vue du client, il saura exactement combien de temps durera la tâche, combien de GPU il utilisera et combien cela lui coûtera à l'avance, ce qui lui donne une certitude en matière de coûts. Lorsqu'un utilisateur s'inscrit au service, celui-ci affiche le coût total pour la durée et les ressources. Les utilisateurs peuvent augmenter ou diminuer ce coût, en fonction de leur appétit pour les ressources et de leur budget, avant d'accepter d'acheter. Cette nouvelle fonctionnalité est généralement disponible à partir d'aujourd'hui dans la région AWS US East (Ohio).


Source : Amazon AWS a lancé Elastic Compute Cloud (EC2)

Et vous ?

Que pensez-vous du nouveau service Amazon EC2, le trouvez-vous intéressant ?

Voir aussi

AWS annonce un "cloud souverain" pour soutenir la résidence des données en Europe, une filiale d'Amazon promet un "cloud indépendant pour l'Europe"

Amazon Web Services acquiert Fig, une petite entreprise de San Francisco qui aide les développeurs à être plus efficaces et à collaborer tout en utilisant la ligne de commande

L'empire IPv4 d'AWS vaut désormais 4,5 milliards de dollars, AWS a augmenté son parc IPv4 de 27 millions d'adresses IP supplémentaires et possède désormais 128 millions d'adresses IPv4

Une erreur dans cette actualité ? Signalez-nous-la !