OpenAI développe actuellement un outil de génération musicale basé sur l'IA qui crée des morceaux à partir de textes et d'enregistrements audio. L'entreprise collabore avec Juilliard afin d'obtenir des données d'entraînement de haute qualité pour résoudre les problèmes d'originalité et de droits d'auteur. S'appuyant sur Jukebox, cet outil pourrait être intégré à des outils vidéo tels que Sora. Cette initiative pourrait démocratiser la production musicale au milieu des débats éthiques.
En mai 2024, ElevenLabs, connu pour ses voix d'IA naturelles et son clonage vocal précis, a partagé un premier aperçu de son produit de conversion de texte en musique, ElevenLabs Music. Cet outil permet de créer des chansons complètes avec des voix réalistes à partir d'un simple texte. Cependant, la génération de musique par l'IA n'est pas bien accueillie par tous. Comme pour toutes les applications d'IA générative, la question était de savoir sur quoi ElevenLabs a formé ce modèle et s'il comprenait des éléments protégés par le droit d'auteur.
Dans le monde en rapide évolution de l'IA, OpenAI se lancerait dans la génération musicale, une initiative qui pourrait transformer la manière dont les créateurs produisent du contenu audio. OpenAI, une organisation américaine spécialisée dans l'intelligence artificielle (IA), est notamment connue pour la famille de grand modèle de langage GPT, la série DALL-E de modèles de conversion de texte en image et un modèle de conversion de texte en vidéo nommé Sora. La sortie de ChatGPT en novembre 2022 a été saluée comme ayant catalysé l'intérêt général pour l'IA générative.
Selon un rapport, la société à l'origine de ChatGPT développe un outil capable de créer de la musique à partir de textes et d'instructions audio. Cette initiative marque la première incursion significative d'OpenAI dans la musique générée par l'IA, s'appuyant sur ses avancées existantes dans la génération de textes, d'images et de vidéos. Des sources proches du projet indiquent qu'OpenAI collabore avec des étudiants de la Juilliard School pour annoter des partitions musicales.
Ce partenariat vise à générer des données d'entraînement de haute qualité, afin de résoudre l'un des problèmes les plus épineux de la musique générée par l'IA : garantir l'originalité et éviter les pièges du droit d'auteur. L'outil est conçu pour produire des morceaux à partir de descriptions simples ou d'extraits audio existants, à l'instar de ce que font des concurrents tels que Suno et Udio.
Contourner les obstacles liés aux droits d'auteur et à l'éthique
Cette incursion dans le domaine de la musique intervient dans un contexte de débats plus larges sur la propriété intellectuelle au sein de l'industrie. Les efforts d'OpenAI font suite à une période d'hésitation ; le PDG Sam Altman avait précédemment exprimé des réserves sur la musique générée par l'IA en raison de son impact potentiel sur les artistes. Cependant, avec des concurrents tels que MusicFX de Google et Stable Audio de Stability AI déjà présents sur le marché, OpenAI semble prêt à entrer en concurrence en tirant parti de ses vastes ressources.
Cet outil pourrait s'intégrer à des plateformes vidéo, permettant aux utilisateurs d'ajouter des bandes sonores personnalisées ou des couches instrumentales à des séquences vidéo. Cette fonctionnalité s'inscrit dans la lignée des récentes mises à jour apportées par OpenAI à Sora, son modèle de génération vidéo, qui inclut désormais des fonctionnalités telles que des caméos de personnages et des éléments tendance en temps réel.
En coulisses, l'outil musical d'OpenAI s'inspire probablement des enseignements tirés de projets tels que Jukebox, un réseau neuronal antérieur lancé en 2020 qui générait des fichiers audio bruts dans différents styles, selon l'annonce faite par la société elle-même. Cependant, pour que cet outil soit commercialement viable, il faut surmonter des obstacles liés à la qualité des données et à la complexité du modèle. Les défis actuels de la musique générée par l'IA, tels que le maintien d'une structure à grande échelle dans les compositions, les observateurs notent que les modèles actuels excellent souvent dans les détails locaux mais pèchent par manque de cohérence globale.
La collaboration avec Juilliard souligne une approche stratégique de la formation des données. Cela pourrait contribuer à créer des ensembles de données « défendables », atténuant ainsi les risques juridiques qui ont affecté d'autres entreprises de musique générée par l'IA. Les poursuites judiciaires contre des entreprises telles que Suno, accusées d'avoir utilisé sans autorisation des contenus protégés par le droit d'auteur, servent d'avertissement.
En effet, en 2024, les grandes maisons de disques ont intenté des poursuites contre les entreprises de génération de musique IA Suno et Udio, les accusant davoir formé leur technologie IA sur des uvres non autorisées de certains des plus grands artistes mondiaux. Les plaintes, déposées dans les États du Massachusetts et de New York, ont été portées par la Recording Industry Association of America (RIAA), qui représente les trois plus grandes maisons de disques de lindustrie : Universal Music Group, Sony Music Entertainment et Warner Music Group. La RIAA réclame des dommages pouvant atteindre 150 000 dollars par chanson contrefaisante.
Implications commerciales pour les créateurs et les concurrents
Pour les initiés du secteur, l'arrivée d'OpenAI pourrait démocratiser la production musicale, permettant aux cinéastes, aux podcasteurs et aux amateurs de créer des morceaux sur mesure sans avoir besoin d'une expertise traditionnelle. Il s'agit là d'une initiative audacieuse de la part de l'entreprise dans un domaine en pleine croissance, qui pourrait s'intégrer à des outils tels que ChatGPT pour des flux de travail créatifs fluides.
Cependant, des questions éthiques se posent. Les utilisateurs de X ont exprimé leurs inquiétudes concernant l'appropriation culturelle et la dilution de l'art humain, faisant écho aux sentiments exprimés dans OpenTools.ai, qui discute de la nécessité de mettre à jour les cadres réglementaires en matière de droits d'auteur. Les décideurs politiques pourraient bientôt devoir trouver un équilibre entre innovation et protection des artistes.
Bien qu'aucune date de lancement officielle n'ait été annoncée, le projet témoigne de l'ambition d'OpenAI d'étendre son écosystème d'IA. L'outil pourrait se concentrer sur la génération de musique pour les vidéos, des bandes sonores complètes aux accompagnements à la guitare pour les voix. Cela pourrait positionner OpenAI face aux startups tout en complétant ses outils vidéo.
Les observateurs du secteur anticipent des défis en matière de commercialisation, notamment en ce qui concerne les modèles de tarification et l'accès aux API. Compte tenu des exigences informatiques élevées pour la génération musicale, , OpenAI pourrait opter pour des services basés sur le cloud afin d'élargir l'accessibilité. En fin de compte, cette évolution souligne le rôle croissant de l'IA dans les industries créatives, promettant à la fois des bouleversements et des opportunités pour ceux qui sont prêts à s'adapter.
