
la startup Respeecher utilise des extraits sonores pour « cloner » la voix de l'acteur
James Earl Jones est la voix emblématique de Dark Vador depuis le début de Star Wars, mais à 91 ans, il semble qu'il soit prêt à laisser l'IA reprendre le flambeau. Jones a cédé les droits sur les archives vocales de son travail, permettant à la startup ukrainienne Respeecher de tirer parti de la technologie IA et de recréer le son de sa voix dans Obi-Wan Kenobi de Disney Plus.
Pour ce faire, Respeecher utilise des extraits sonores pour « cloner » la voix d'un acteur, permettant à un studio d'enregistrer de nouvelles répliques sans la présence de l'acteur. Matthew Wood, le monteur sonore superviseur de Skywalker Sound, a déclaré qu'il avait présenté l'option à Jones une fois qu'il avait « mentionné qu'il envisageait de mettre fin » au rôle de Dark Vador. Après que Jones ait donné à Lucasfilm la permission d'utiliser la voix générée par l'IA, le studio avait chargé Respeecher de produire une sortie semblable à la voix de Jones, qui incarnait le « méchant du côté obscur d'il y a 45 ans », dans Obi-Wan Kenobi de Disney Plus.
C'est pourquoi vous remarquerez peut-être que Vador ressemble beaucoup à ce qu'il faisait dans les films précédents d'Obi-Wan, par opposition à la voix réelle de Jones dans The Rise of Skywalker en 2019. Malgré l'utilisation par le studio de l'IA pour la voix de Vador, Wood dit que Jones assume le rôle d'un « parrain bienveillant » et aide toujours à guider la représentation du méchant par le studio.
Matthew Wood était le monteur sonore superviseur à la réception des transmissions en provenance d'Ukraine.
Ce que Respeecher pouvait faire mieux que quiconque était de recréer la façon inoubliablement menaçante dont Jones, maintenant âgé de 91 ans, s'exprimait il y a des décennies. Wood estime qu'il a enregistré l'acteur au moins une douzaine de fois, la dernière fois étant une brève ligne de dialogue dans The Rise of Skywalker en 2019. « Il avait mentionné qu'il cherchait à éliminer ce personnage en particulier », explique Wood. « Alors, comment pouvons-nous avancer ? » Lorsqu'il a finalement présenté à Jones le travail de Respeecher, l'acteur a approuvé l'utilisation de ses enregistrements vocaux d'archives pour garder Vador en vie même par des moyens artificiels – appropriés, peut-être, pour un personnage à moitié mécanique. Jones est reconnu pour avoir guidé la performance sur Obi-Wan Kenobi, et Wood décrit sa contribution comme celle « d'un parrain bienveillant ». Ils informent l'acteur de leurs plans pour Vador et tiennent compte de ses conseils sur la façon de rester sur la bonne voie.
Avant l'invasion, il y avait une volée d'informations quasi constante entre Wood, Deborah Chow la réalisatrice et showrunner d'Obi-Wan Kenobi et l'équipe Respeecher. Wood dit : « Pour un personnage tel que Dark Vador, qui pourrait avoir 50 lignes dans une émission, je pourrais avoir un va-et-vient de près de 10 000 fichiers ». Une grande partie de cela était des changements dans le dialogue et les ajustements ultérieurs. Alors que l'attaque russe se profilait, dit Wood, il a commencé à prendre du recul. Il se souvient avoir pensé, je n'ai pas besoin de revenir vers eux alors qu'ils entendent la sirène de raid aérien pour leur communiquer que cette partie particulière est un peu différente. Mais l'attitude de l'équipe Respeecher, dit-il, était : « Travaillons, travaillons face à cette adversité, persévérons ».
Alex Serdiuk, PDG et cofondateur de la société de clonage de voix, sait que créer la voix de Dark Vador pour une émission de télévision n'est pas une entreprise de vie ou de mort. Pourtant, il est fier de leur contribution à Obi-Wan Kenobi et veut que le monde sache que les Ukrainiens ont aidé à rendre ce voyage particulier dans la galaxie très, très loin possible, même dans des circonstances horribles. « Nous créons des lieux de travail pour les gens, nous créons des emplois, nous leur versons de l'argent, nous contribuons à l'économie ukrainienne, et c'est très significatif », dit-il. « Mais aussi, espérons-le, plus de gens entendront parler de l'Ukraine - de notre communauté technologique, de nos start-up - grâce à cela ».
Le travail de Respeecher s'est poursuivi, principalement sur des projets encore secrets.
Ce que Respeecher pouvait faire mieux que quiconque était de recréer la façon inoubliablement menaçante dont Jones, maintenant âgé de 91 ans, s'exprimait il y a des décennies. Wood estime qu'il a enregistré l'acteur au moins une douzaine de fois, la dernière fois étant une brève ligne de dialogue dans The Rise of Skywalker en 2019. « Il avait mentionné qu'il cherchait à éliminer ce personnage en particulier », explique Wood. « Alors, comment pouvons-nous avancer ? » Lorsqu'il a finalement présenté à Jones le travail de Respeecher, l'acteur a approuvé l'utilisation de ses enregistrements vocaux d'archives pour garder Vador en vie même par des moyens artificiels – appropriés, peut-être, pour un personnage à moitié mécanique. Jones est reconnu pour avoir guidé la performance sur Obi-Wan Kenobi, et Wood décrit sa contribution comme celle « d'un parrain bienveillant ». Ils informent l'acteur de leurs plans pour Vador et tiennent compte de ses conseils sur la façon de rester sur la bonne voie.
Avant l'invasion, il y avait une volée d'informations quasi constante entre Wood, Deborah Chow la réalisatrice et showrunner d'Obi-Wan Kenobi et l'équipe Respeecher. Wood dit : « Pour un personnage tel que Dark Vador, qui pourrait avoir 50 lignes dans une émission, je pourrais avoir un va-et-vient de près de 10 000 fichiers ». Une grande partie de cela était des changements dans le dialogue et les ajustements ultérieurs. Alors que l'attaque russe se profilait, dit Wood, il a commencé à prendre du recul. Il se souvient avoir pensé, je n'ai pas besoin de revenir vers eux alors qu'ils entendent la sirène de raid aérien pour leur communiquer que cette partie particulière est un peu différente. Mais l'attitude de l'équipe Respeecher, dit-il, était : « Travaillons, travaillons face à cette adversité, persévérons ».
Alex Serdiuk, PDG et cofondateur de la société de clonage de voix, sait que créer la voix de Dark Vador pour une émission de télévision n'est pas une entreprise de vie ou de mort. Pourtant, il est fier de leur contribution à Obi-Wan Kenobi et veut que le monde sache que les Ukrainiens ont aidé à rendre ce voyage particulier dans la galaxie très, très loin possible, même dans des circonstances horribles. « Nous créons des lieux de travail pour les gens, nous créons des emplois, nous leur versons de l'argent, nous contribuons à l'économie ukrainienne, et c'est très significatif », dit-il. « Mais aussi, espérons-le, plus de gens entendront parler de l'Ukraine - de notre communauté technologique, de nos start-up - grâce à cela ».
Le travail de Respeecher s'est poursuivi, principalement sur des projets encore secrets.
D'autres outils de synthèse vocale IA tels que Voicemod, Veritone, Descript et Resemble AI sont également apparus comme des moyens potentiels pour les célébrités et les créateurs de recréer numériquement leurs voix. Comme l'a souligné un internaute, la tendance pourrait devenir populaire parmi les célébrités qui veulent « augmenter leurs revenus avec un minimum d'effort en clonant et en louant leur voix ». Ou, dans le cas de Jones, cela pourrait aider à préserver la voix de l'un des méchants les plus célèbres du cinéma.
L'IA et l'art, un mélange difficilement miscible ?
Si du côté de l'audio, il peut exister une tournure qui semble intéressante pour certaines personnes, une grosse zone grise subsiste lorsqu'il s'agit de création.
Prenons l'art visuel par exemple.
L'arrivée de modèles de synthèse d'images largement disponibles, tels que Midjourney et Stable Diffusion, a provoqué une intense bataille en ligne entre les artistes qui considèrent les œuvres assistées par l'IA comme une forme de vol et ceux qui accueillent avec enthousiasme ces nouveaux outils de création. Les communautés d'artistes établies sont à la croisée des chemins, car elles craignent que les œuvres non-IA soient noyées dans une offre illimitée d'œuvres générées par l'IA, alors que ces outils sont devenus très populaires parmi certains de leurs membres.
En interdisant l'art créé par synthèse d'image sur son portail d'art, Newgrounds a écrit : « Nous voulons garder l'accent sur l'art fait par des personnes et ne pas inonder le portail d'art avec de l'art généré par ordinateur ». Fur Affinity a cité des préoccupations concernant l'éthique de la façon dont les modèles de synthèse d'images apprennent à partir d'œuvres d'art existantes, écrivant : « Notre objectif est de soutenir les artistes et leur contenu. Nous ne pensons pas qu'il soit dans l'intérêt de notre communauté d'autoriser du contenu généré par l'IA sur le site ». Ce ne sont que les derniers mouvements dans un débat qui évolue rapidement sur la façon dont les communautés artistiques (et les professionnels de l'art) peuvent s'adapter à un logiciel qui peut potentiellement produire des œuvres illimitées d'art magnifique à un rythme qu'aucun humain travaillant sans les outils ne pourrait égaler.
Ce n'est un secret pour personne que des modèles de synthèse d'images comme Stable Diffusion ont été formés, en partie, à l'aide de sites Web de photographies de stock. Avec l'apparition de l'art de l'IA sur des sites comme Shutterstock, si les futurs modèles d'images d'IA formés sur des images récupérées sur Internet apprennent de leur propre production, l'avenir de l'art pourrait en effet être très récursif.
Mais alors, que signifie le fait de pouvoir générer n'importe quel type de contenu visuel, image ou vidéo, avec quelques lignes de texte et un clic sur un bouton ? Qu'en sera-t-il lorsque vous pourrez générer un scénario de film avec GPT-3 et une animation de film avec DALL-E 2 ? Et si l'on regarde plus loin, que se passera-t-il lorsque les algorithmes des médias sociaux ne se contenteront pas de sélectionner du contenu pour votre flux, mais le généreront ? Qu'en sera-t-il lorsque, dans quelques années, cette tendance rencontrera le métavers et que des mondes de réalité virtuelle seront générés en temps réel, rien que pour vous ?
Ce sont toutes des questions importantes à considérer. Certains pensent qu'à court terme, cela signifie que la créativité humaine et l'art sont profondément menacés. Peut-être que dans un monde où tout le monde peut générer n'importe quelle image, les graphistes tels que nous...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.