IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Le modèle IA musical Lyria 3 de Google arrive sur Gemini et vous permet de générer 30 secondes de musique à partir de simple instructions génératives de texte et d'images

Le , par Jade Emy

146PARTAGES

5  0 
Le modèle IA musical Lyria 3 de Google arrive sur Gemini et vous permet de générer 30 secondes de musique à partir de simple instructions génératives de texte et d'images

Google lance la génération musicale Lyria 3 directement dans l'application Gemini, permettant aux utilisateurs de créer des morceaux de 30 secondes à partir de texte et d'images. Cette sortie marque le premier produit d'IA musicale grand public de Google, en concurrence avec des startups telles que Suno et Udio dans le domaine de l'audio génératif. Lyria 3 représente une expansion multimodale significative pour Gemini, ajoutant la composition audio à ses capacités existantes en matière de texte et d'image. Ce lancement témoigne de la stratégie de Google qui consiste à regrouper des outils d'IA créatifs dans une seule application grand public plutôt que de lancer des produits autonomes.

Gemini, anciennement Bard, est un assistant conversationnel développé par l'entreprise Google. Gemini peut comprendre et interagir avec l'audio et la vidéo, et générer du texte (poésie, scripts, pièces musicales, courriels, lettres, etc.), du code, des traductions (entre plus de 100 langues). Il peut produire plusieurs types de contenu créatif (images, dessins, sons, musique, vidéos…), aider des chercheurs en analysant des données ou en générant des hypothèses. Gemini peut répondre aux questions de manière informative ou en produisant des cours personnalisés, des jeux, des tutoriels, etc., avec les limites des IA (erreurs, biais, « hallucinations »…).

Google vient d'ouvrir la porte à la création musicale alimentée par l'IA pour tous. L'application Gemini de la société inclut désormais Lyria 3, son dernier modèle de génération musicale qui transforme des invites textuelles et des images en morceaux personnalisés de 30 secondes. Cette initiative place Google en concurrence directe avec des start-ups telles que Suno et Udio, tout en étendant les capacités multimodales de Gemini au-delà du texte et des images pour inclure la composition audio. Selon Joël Yawili, chef de produit senior pour l'application Gemini, cela représente « une nouvelle façon de s'exprimer » grâce à des paysages sonores générés par l'IA.

Cette intégration fait de Google la première grande plateforme technologique à intégrer la génération musicale dans un assistant IA polyvalent. Alors qu'OpenAI et Anthropic se concentrent sur le texte et le raisonnement, Google oriente Gemini vers la production créative. Les utilisateurs peuvent désormais demander à Gemini de générer un « morceau de synthé rêveur pour un timelapse au coucher du soleil » ou télécharger une photo d'un paysage urbain et obtenir une musique d'ambiance correspondante, le tout sans quitter l'application.

Selon l'annonce officielle, Lyria 3 produit des « morceaux de 30 secondes de haute qualité » à partir d'entrées textuelles et d'images. Cette limite de 30 secondes est stratégique : elle est suffisamment longue pour les clips sur les réseaux sociaux et la création de contenu, et suffisamment courte pour contourner les questions épineuses de droits d'auteur qui affectent les compositions plus longues générées par l'IA. C'est également la même durée que celle initialement proposée par des startups comme Suno avant de passer à des chansons complètes.


Google teste discrètement l'IA musicale depuis plus d'un an. La société a présenté pour la première fois la technologie Lyria fin 2023 via MusicLM, un outil expérimental accessible uniquement à certains utilisateurs. Mais MusicLM est resté confiné dans l'AI Test Kitchen de Google, sans jamais devenir un produit grand public. L'intégration de Lyria 3 dans Gemini marque le passage d'une expérimentation prudente à un déploiement confiant.

Ce timing met la pression sur les start-ups indépendantes spécialisées dans l'IA musicale. Suno et Udio ont levé des millions de dollars pour développer des applications autonomes de génération musicale par IA, pariant que les utilisateurs seraient prêts à payer un abonnement pour bénéficier de cette fonctionnalité. Aujourd'hui, Google l'offre gratuitement dans le cadre de l'offre plus large de Gemini. C'est le jeu classique des plateformes : regrouper suffisamment de fonctionnalités dans une seule application pour que les spécialistes aient du mal à rivaliser.

Ce qui rend Lyria 3 particulièrement intéressant, c'est sa capacité à transformer des images en musique. Téléchargez une photo de vagues déferlantes et il générera du surf rock. Montrez-lui une ruelle éclairée au néon et vous obtiendrez de l'électronica cyberpunk. Cette traduction visuelle en audio représente un modèle d'interaction véritablement nouveau, différent des approches axées sur le texte adoptées par la plupart des outils musicaux basés sur l'IA. Google tire parti de sa force dans le domaine de l'IA multimodale, où les modèles comprennent les connexions entre différents types de médias.

L'annonce de Joël Yawili, chef de produit senior pour Gemini, présente la génération musicale comme une forme d'expression personnelle plutôt que comme une production professionnelle. Ce positionnement est prudent : Google ne prétend pas que cela remplacera les musiciens ou les producteurs. Au contraire, cet outil est présenté comme un outil destiné aux créateurs de contenu, aux utilisateurs des réseaux sociaux et aux expérimentateurs occasionnels. Pensez aux bandes sonores de TikTok et aux arrière-plans des stories Instagram, plutôt qu'aux tubes du Billboard.

Mais l'industrie musicale observe la situation avec nervosité. La Recording Industry Association of America a déjà intenté des poursuites contre Suno et Udio, affirmant qu'ils avaient entraîné des modèles sur des chansons protégées par le droit d'auteur sans autorisation. Google n'a pas détaillé les données d'entraînement de Lyria 3, mais l'entreprise est confrontée à la même question fondamentale : comment créer une IA musicale sans apprendre à partir de la musique existante ? Google mise probablement sur ses ressources juridiques et ses relations de licence existantes pour naviguer dans des eaux qui ont submergé les petits acteurs.


Cette fonctionnalité arrive alors que Google s'efforce de maintenir la compétitivité de Gemini face à ChatGPT et Claude. Alors que ces concurrents se sont concentrés sur les capacités de raisonnement et les fenêtres contextuelles plus longues, Google se différencie par son ampleur multimodale. Gemini peut désormais générer du texte, des images et de la musique, un trio qu'aucun autre assistant IA grand public n'offre. Il s'agit d'une stratégie différente, qui privilégie la polyvalence créative à l'intelligence pure.

Différents rapports ont déjà confirmé cette approche de Google. Alors que la compétition autour de l’intelligence artificielle générative est souvent racontée comme une succession de coups médiatiques, de démonstrations spectaculaires et d’annonces parfois précipitées, Google avance à un rythme plus feutré. Avec Gemini, son modèle d’IA unifié, le groupe semble aujourd’hui récolter les fruits d’une stratégie plus structurelle que narrative. Sans déclarer officiellement la victoire, Google apparaît de plus en plus comme un acteur central, voire dominant, dans la phase actuelle de la course à l’IA. C'est en tout cas l'avis de certains spécialistes comme Geoffrey Hinton, le « parrain de l'IA ».

Pour les utilisateurs, l'expérience est simple : ouvrez Gemini, décrivez la musique que vous souhaitez ou téléchargez une image, puis attendez que Lyria 3 génère des options. Les premiers essais suggèrent que la qualité est bonne, sans être spectaculaire : meilleure que celle des morceaux génériques libres de droits, mais pas tout à fait à la hauteur de celle des compositeurs humains. Cela devrait suffire pour la plupart des cas d'utilisation grand public, surtout si le service est gratuit.

La limite de 30 secondes sert également de soupape de sécurité. Des clips plus courts signifient moins de concurrence directe avec les bibliothèques musicales professionnelles, moins de complications en matière de droits d'auteur et des coûts de calcul moins élevés pour Google. Si la fonctionnalité s'avère populaire, il serait facile de passer à des compositions plus longues. Mais en commençant modestement, Google peut tester le terrain sans se lancer tête baissée dans des poursuites judiciaires avec l'industrie musicale.

L'intégration de Lyria 3 dans Gemini par Google vise moins à révolutionner la musique qu'à rendre les assistants IA véritablement utiles pour la créativité au quotidien. Si les musiciens professionnels ne seront pas menacés, les millions de personnes qui créent du contenu social, éditent des vidéos ou expérimentent simplement l'IA ont désormais une raison de moins de quitter l'écosystème Google. Alors que les plateformes d'IA se font concurrence sur leurs capacités, attendez-vous à voir davantage de regroupements de fonctionnalités de ce type : le gagnant ne sera pas nécessairement l'IA la plus intelligente, mais celle qui fait le plus de choses assez bien. Pour l'instant, Google parie que la génération musicale est l'argument qui incitera les utilisateurs à revenir vers Gemini plutôt que vers ChatGPT.


Voici un extrait de l'annonce de Google :

Une nouvelle façon de vous exprimer : Gemini peut désormais créer de la musique.

Depuis le lancement de l'application Gemini, nous avons développé des outils pour encourager l'expression créative à travers des images et des vidéos. Aujourd'hui, nous franchissons une nouvelle étape : la génération de musique personnalisée. Lyria 3, le dernier modèle de musique générative de Google DeepMind, est disponible dès aujourd'hui en version bêta dans l'application Gemini. Il suffit de décrire une idée ou de télécharger une photo, par exemple « un slow R&B comique sur une chaussette qui trouve sa jumelle », et en quelques secondes, Gemini la traduira en un morceau entraînant et de grande qualité. Pour repousser encore plus loin les limites de la créativité, vous pouvez même demander à Gemini de s'inspirer de quelque chose que vous avez téléchargé.

Lyria 3 améliore la génération audio de nos modèles Lyria de trois manières importantes :

1. Vous n'avez pas besoin de fournir vos propres paroles ! Elles seront générées pour vous en fonction de votre demande.

2. Vous avez plus de contrôle créatif sur des éléments tels que le style, les voix et le tempo que vous souhaitez.

3. Vous pouvez créer des morceaux plus réalistes et musicalement plus complexes.

Voici comment vous pouvez l'utiliser :

- Texte en morceau : décrivez un genre, une ambiance, une blague ou un souvenir spécifique pour créer des morceaux uniques avec des paroles ou un accompagnement instrumental qui correspondent à votre humeur. « Je me sens nostalgique. Créez un morceau pour ma mère sur les bons moments que nous avons passés ensemble quand nous étions enfants et les souvenirs de ses bananes plantains cuites maison. Faites-en un morceau afrobeat amusant avec une véritable ambiance africaine. »

- De photos et vidéos à morceau : téléchargez une photo ou une vidéo et regardez Gemini utiliser le contenu pour composer un morceau avec des paroles qui correspondent parfaitement à l'ambiance. « Utilisez ces photos pour créer un morceau sur mon chien Duncan en randonnée dans les bois. »

L'application Gemini crée des morceaux de 30 secondes avec une pochette personnalisée générée par Nano Banana. Il est ainsi facile de les partager rapidement avec vos amis en les téléchargeant ou en cliquant simplement sur le lien de partage. L'objectif de ces morceaux n'est pas de créer un chef-d'œuvre musical, mais plutôt de vous offrir un moyen amusant et unique de vous exprimer.

Les créateurs peuvent également explorer Lyria 3 sur YouTube Dream Track. Disponible aux États-Unis et désormais accessible aux créateurs YouTube d'autres pays, Lyria 3 améliorera la qualité de chaque bande-son unique des Shorts. Qu'il s'agisse de créer des paroles poétiques ou une bande-son entraînante, la possibilité de mieux personnaliser la bande-son permettra aux créateurs de passer au niveau supérieur avec leurs Shorts.


Nouvelles fonctionnalités de vérification audio

Toutes les pistes générées dans l'application Gemini sont intégrées à SynthID, notre filigrane imperceptible permettant d'identifier le contenu généré par l'IA de Google. Nous vous proposons également davantage d'outils pour vous aider à identifier le contenu généré par l'IA, en élargissant nos capacités de vérification dans l'application Gemini pour inclure l'audio, en plus des images et des vidéos. Il vous suffit de télécharger un fichier et de demander s'il a été généré à l'aide de l'IA de Google. Gemini vérifiera la présence de SynthID et utilisera son propre raisonnement pour vous fournir une réponse.

Notre engagement à développer l'IA générative de manière responsable

Depuis le lancement de Lyria en 2023, nous nous efforçons de développer cette technologie de manière responsable, en collaboration avec la communauté musicale. Nous avons beaucoup appris grâce à ces collaborations et à nos expériences, comme Music AI Sandbox, et nous avons été très attentifs aux droits d'auteur et aux accords avec nos partenaires lors de la formation de Lyria 3.

La génération musicale avec Lyria 3 est conçue pour permettre une expression originale, et non pour imiter des artistes existants. Si votre invite mentionne un artiste spécifique, Gemini s'en inspirera de manière créative et créera un morceau qui partage un style ou une ambiance similaire. Nous avons également mis en place des filtres pour vérifier les résultats par rapport au contenu existant. Nous reconnaissons que notre approche n'est peut-être pas infaillible, c'est pourquoi vous pouvez signaler tout contenu susceptible de violer vos droits ou ceux d'autrui. De plus, pour utiliser nos produits, les utilisateurs doivent respecter nos conditions d'utilisation et nos politiques d'utilisation interdite de Gen AI, qui interdisent les violations des droits de propriété intellectuelle et de confidentialité d'autrui.

Lyria 3 est disponible dans l'application Gemini pour tous les utilisateurs âgés de 18 ans et plus en anglais, allemand, espagnol, français, hindi, japonais, coréen et portugais. Nous prévoyons d'améliorer la qualité et d'étendre la couverture à d'autres langues. L'application est disponible dès aujourd'hui sur ordinateur et le sera dans les prochains jours sur mobile. Les abonnés à Google AI Plus, Pro et Ultra bénéficieront de limites plus élevées.

Notre objectif avec la génération de musique dans l'application Gemini est de vous aider à ajouter une bande-son personnalisée et amusante à votre quotidien.

Source : Annonce de Google

Et vous ?

Pensez-vous que cette annonce est crédible ou pertinente ?
Quel est votre avis sur le sujet ?

Voir aussi :

Google intègre des filigranes inaudibles appelés SynthID dans sa musique générée par l'IA, la protection contre les contrefaçons ne devrait pas compromettre la vie privée des utilisateurs

OpenAI développe un outil de génération musicale basé sur l'IA qui crée des morceaux à partir de textes et d'enregistrements audio, en collaboration avec Juilliard pour résoudre les problèmes de droits d'auteur

Un syndicat de musiciens de Hollywood menace de déclencher une grève générale si ses membres n'obtiennent pas des protections contre l'IA et des droits résiduels pour le streaming
Vous avez lu gratuitement 6 495 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !