Ces derniers jours, un logiciel appelé Deep-Live-Cam est devenu viral sur les médias sociaux parce qu'il est capable d'extraire le visage d'une personne à partir d'une seule photo et de l'appliquer à une source vidéo webcam en direct tout en suivant la pose, l'éclairage et les expressions de la personne sur la webcam. Bien que les résultats ne soient pas parfaits, le logiciel montre la rapidité avec laquelle la technologie se développe et comment la capacité de tromper les autres à distance devient de plus en plus facile au fil du temps.Les récentes avancées en matière d'IA ont entraîné des défis importants, en particulier avec la montée des deepfake. Le projet Deep Live Cam vient rajouter de la complexité à la situation puisqu'il permet de changer de visage en temps réel grâce à l'IA, une fonctionnalité qui peut être utilisée lors d'appels vidéo.
Le projet de logiciel Deep-Live-Cam est en cours depuis la fin de l'année dernière, mais des vidéos d'exemple montrant une personne avec le visage d'Elon Musk et le candidat républicain à la vice-présidence J.D. Vance (entre autres) en temps réel ont fait le tour du web. L'avalanche d'attention a brièvement fait bondir le projet open source à la première place de la liste des dépôts en vogue de GitHub, où il peut être téléchargé gratuitement.
« Il est étrange de constater que toutes les innovations majeures issues de la technologie ces derniers temps relèvent de l'arbre de compétences de la fraude », a écrit l'illustrateur Corey Brickley dans un fil de discussion X réagissant à un exemple de vidéo de Deep-Live-Cam en action. Dans un autre message, il a écrit : « N'oubliez pas d'établir des mots de code avec vos parents », faisant référence au potentiel d'utilisation d'outils similaires pour la tromperie à distance et au concept d'utilisation d'un mot sûr, partagé par les amis et la famille, pour établir votre véritable identité.
[TWITTER]<blockquote class="twitter-tweet"><p lang="en" dir="ltr">Nice remember to establish code words with your parents everyone <a href="https://t.co/9hWLxMgtKF">https://t.co/9hWLxMgtKF</a></p>— Corey Brickley Illustration. Justice for Palestine (@CoreyBrickley) <a href="https://twitter.com/CoreyBrickley/status/1823234384876515554?ref_src=twsrc%5Etfw">August 13, 2024</a></blockquote> <script async src="https://platform.twitter.com/widgets.js" charset="utf-8"></script> [/TWITTER]
La technologie d'échange de visages n'est pas nouvelle. Le terme « deepfake » lui-même est issu de la combinaison des termes « deep learning » et « fake ». À l'époque, la technologie était coûteuse et lente et ne fonctionnait pas en temps réel. Toutefois, grâce à des projets tels que Deep-Live-Cam, il est de plus en plus facile pour quiconque d'utiliser cette technologie à la maison avec un PC ordinaire et un logiciel gratuit.
Les dangers des « deepfakes » ne sont pas nouveaux non plus.
Nous pouvons citer le cas d'un employé du secteur financier qui a versé 25 millions de dollars à des escrocs qui se faisaient passer pour le directeur financier de son entreprise grâce à la technologie du deepfake lors d’un appel vidéo, selon la police de Hong Kong. L’arnaque élaborée a consisté à faire croire à l’employé qu’il participait à un appel vidéo avec plusieurs autres membres du personnel, mais tous étaient en fait des créations de deepfake, a déclaré la police de Hong Kong lors d’un briefing. « Dans la conférence vidéo à plusieurs personnes, il s’avère que tout le monde (qu’il a vu) était faux », a déclaré le surintendant principal Baron Chan Shun-ching à la radio publique RTHK.
Avec les innovations dans le clonage de la voix, le cocktail pourrait être explosif
Il y a quelques années, les voix synthétiques semblaient avoir atteint un plafond de verre.
Reproduire une voix spécifique est encore plus difficile : non seulement l'outil devait avoir une voix humaine, mais cette voix devait également ressembler à la votre. Ces dernières années, cependant, les entreprises dans ces domaines ont commencé à bénéficier de plus d'argent, de plus de données (surtout des tonnes d'enregistrements vocaux en ligne) et de percées dans les logiciels sous-jacent utilisés pour générer la parole.
En 2019, ces avancées ont porté leurs fruits : une société d'IA basée à Toronto, Dessa, a cloné la voix du podcasteur Joe Rogan. (À l'époque, Rogan a réagi avec « stupeur » sur Instagram, déclarant : « L'avenir va être vraiment extrêmement bizarre »). Mais Dessa a eu besoin de beaucoup d'argent et de centaines d'heures de la voix très disponible de Rogan pour fabriquer son produit. Leur succès a été ponctuel....
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.