Les auditeurs eux-mêmes ont émis des critiques, regrettant l'absence de filtres pour distinguer les narrations humaines des narrations par IA lorsqu'ils parcourent les catalogues. Pendant ce temps, les éditeurs cherchent à réduire les coûts sans compromettre la qualité, en concluant des accords avec des entreprises spécialisées dans la voix artificielle. Cette montée des tensions met en lumière les défis auxquels sont confrontés les différents acteurs de l'industrie, les incitant à trouver un équilibre entre l'innovation technologique et le maintien de l'intégrité artistique et des emplois humains.
Audible, un service américain de livres audio et de podcasts en ligne, offre aux utilisateurs la possibilité d'acheter et de diffuser une variété de contenus parlés, y compris des livres audio. Il propose un modèle d'abonnement où les utilisateurs reçoivent des crédits échangeables contre des contenus mensuels et ont accès à une bibliothèque de contenus à la demande. Audible, le principal producteur et détaillant de livres audio aux États-Unis, est une filiale à part entière d'Amazon, basée à Newark, dans le New Jersey.
La première offre de la société était l'Audible MobilePlayer, un lecteur multimédia portable lancé en 1997, qui pouvait stocker jusqu'à deux heures d'audio avec sa mémoire flash de quatre mégaoctets. Pour utiliser le lecteur, les utilisateurs devaient télécharger les livres audio depuis le site web d'Audible.
En 1999, Microsoft a investi 11 millions de dollars dans l'entreprise, mais peu après, le PDG d'Audible, Andrew J. Huffman, est décédé, marquant un moment difficile. Cependant, le développement s'est poursuivi, avec l'obtention par Audible d'une licence pour le codec ACELP en 2000, et Amazon a acquis une participation de 5 % dans l'entreprise la même année, alors qu'elle était déjà cotée en bourse.
En 2003, Audible a conclu un partenariat exclusif avec Apple pour la distribution de livres audio sur l'iTunes Music Store, une association qui a pris fin en 2017 suite à des décisions antitrust de l'Union européenne.
Par la suite, Audible a lancé « Audible Air » en 2005, permettant aux utilisateurs de télécharger des livres audio directement sur des appareils mobiles comme les PDA et les smartphones. Ce service offrait une mise à jour automatique du contenu, téléchargeant les chapitres au fur et à mesure des besoins, et les supprimant après lecture. En 2006, la société a inauguré sa collection A-List, proposant des œuvres populaires lues par des personnalités telles que Anne Hathaway et Annette Bening.
Une révolution dans la narration audio ou une menace pour l'emploi humain ?
Depuis l'annonce, l'année dernière, d'un outil bêta permettant aux auteurs autoédités de générer des narrations par « voix virtuelle » pour leurs livres électroniques, plus de 40 000 titres narrés par l'IA ont afflué sur Audible. Ces chiffres impressionnants, révélés dans un récent rapport, réjouissent de nombreux auteurs, mais suscitent également l'inquiétude des narrateurs humains.
L'outil de narration virtuelle d'Amazon propose aux auteurs indépendants une solution économique pour la création de livres audio, évitant ainsi les frais élevés des narrateurs classiques. Bien que certains, comme George Steffanos, aient une préférence pour les narrations humaines, des considérations financières les incitent à adopter cette technologie. Néanmoins, des préoccupations émergent, notamment chez les auditeurs qui déplorent l'absence de filtres pour les narrations par IA dans le catalogue d'Audible. Dans le même temps, les narrateurs humains expriment leurs craintes quant aux possibles pertes d'emploi liées aux progrès technologiques, soulignant ainsi les défis auxquels l'industrie est confrontée avec l'avènement des narrations virtuelles.
Un porte-parole d'Audible a souligné que, pendant la phase bêta, la plateforme recueille les commentaires de ses clients pour continuer à innover en leur nom. Il a également noté que ces livres audio générés par l'IA bénéficient d'une note moyenne de plus de 4 étoiles. Malgré cela, certains consommateurs redoutent que cette évolution ne compromette l'emploi des narrateurs et n'entraîne une dégradation de la qualité.
Un utilisateur mécontent a partagé sur les réseaux sociaux son désarroi quant aux narrations par Virtual Voice sur Audible, soulignant la qualité de ces voix. Comparativement à leurs homologues dans l'industrie musicale, les narrateurs de livres audio semblent être confrontés à la montée en puissance de l'IA sans disposer de moyens de protection similaires. Ramon de Ocampo, un narrateur, a également alerté sur ce sujet sur les réseaux sociaux, mettant en garde contre la menace que représente la voix virtuelle d'Amazon pour l'emploi humain.
Il convient de noter qu'Audible n'accepte que les livres audio narrés par l'IA créés avec une voix virtuelle ou avec une approbation explicite. Dans mes discussions avec des professionnels de l'édition, la plupart ont exprimé une certaine réticence vis-à-vis de l'utilisation généralisée de l'IA dans les livres audio, bien que son utilisation pour les traductions soit perçue comme plus pertinente.
Personnellement, j'ai récemment écouté I'm Glad My Mom Died de Jennette McCurdy, où l'actrice donne vie à ses mémoires avec une remarquable authenticité. Son implication souligne l'importance de la narration humaine dans la transmission d'une histoire et soulève des questions sur le potentiel des narrations par IA à capturer cette même essence.
[Tweet]<blockquote class="twitter-tweet"><p lang="en" dir="ltr"><a href="https://twitter.com/ramondeocampo?ref_src=twsrc%5Etfw">@ramondeocampo</a> I see you're still narrating for Audible, as seen by the list of titles with your name attached, so, Virtual Voice isn't taking away all narration jobs. I have let Audible know that I'm critical of using that software.</p>— Brian Runyon (@bjr12777) <a href="https://twitter.com/bjr12777/status/1736144833880748189?ref_src=twsrc%5Etfw">December 16, 2023</a></blockquote> <script async src="https://platform.twitter.com/widgets.js" charset="utf-8"></script>[/Tweet]
L'émergence des livres audio narrés par l'IA est un phénomène qui illustre à la fois les opportunités et les défis de l'intégration de la technologie dans le domaine de la narration. Du point de vue des auteurs indépendants, l'outil de narration virtuelle représente indéniablement une option attrayante, offrant une alternative économique pour la production de livres audio et permettant ainsi une plus grande accessibilité au marché. Cependant, cette commodité financière peut être perçue comme une menace par les narrateurs humains, dont les emplois sont potentiellement menacés par l'automatisation croissante des processus de narration.
D'un autre côté, les préoccupations des auditeurs concernant la qualité des narrations par IA mettent en évidence une véritable question sur l'expérience utilisateur et la préservation de la valeur artistique. L'absence de filtres pour distinguer les narrations humaines des narrations par IA dans les catalogues peut entraîner une frustration légitime chez les consommateurs, compromettant ainsi leur satisfaction et leur fidélité à la plateforme.
Les éditeurs, quant à eux, se retrouvent dans une position délicate, cherchant à équilibrer les impératifs économiques avec la préservation de la qualité et de l'intégrité artistique. Leur engagement dans des accords avec des entreprises spécialisées dans la voix artificielle témoigne de leur volonté de s'adapter aux évolutions technologiques tout en maintenant des normes élevées de production.
En fin de compte, cette situation met en lumière les tensions inévitables entre progrès technologique et préservation de l'emploi humain, entre efficacité économique et qualité artistique. Il est crucial que les acteurs de l'industrie abordent ces défis de manière réfléchie et éthique, en recherchant un équilibre qui bénéficie à toutes les parties prenantes, tout en garantissant que l'innovation technologique ne se fasse pas au détriment de la richesse et de la diversité de l'expérience culturelle.
Sources : Audible, Ramon de Ocampo, a narrator on Twitter
Et vous ?
Partagez-vous les préoccupations des narrateurs humains concernant les pertes d'emploi ?
Croyez-vous que les préoccupations des auditeurs concernant la qualité des narrations par intelligence artificielle pourraient avoir un impact sur leurs décisions d'achat et leur fidélité envers la plateforme d'Audible ?
Voir aussi :
YouTube teste un outil d'IA qui crée des pistes audio pour aider les créateurs à doubler automatiquement leurs vidéos dans d'autres langues, ce qui menace le travail des doubleurs humains
BASE TTS, le plus grand modèle d'IA pour la synthèse vocale montre des capacités émergentes, conçu par les chercheurs d'Amazon, entraîné sur 100 000 heures de données vocales du domaine public
OpenAI affirme pouvoir cloner une voix juste à partir d'un enregistrement audio de 15 secondes, mais juge son outil de clonage de voix trop risqué pour être diffusé à grande échelle