IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Comment une YouTubeuse tente « d'empoisonner » les robots d'IA qui lui volent son contenu en tirant parti du format Advanced SubStation Alpha,
Pour dissimuler des données parasites

Le , par Bruno

96PARTAGES

3  0 
Dans un contexte où l'intelligence artificielle redéfinit l'écosystème numérique, les créateurs de contenu se trouvent confrontés à une nouvelle menace : le pillage automatisé de leurs vidéos par des algorithmes de résumé et de transcription. La YouTubeuse F4mi illustre parfaitement cette résistance en développant une méthode ingénieuse pour contrecarrer ces pratiques. Exploitant les capacités avancées du format de sous-titres .ass, elle parvient à insérer du texte invisible et perturbateur dans ses vidéos, rendant leur extraction par des IA largement inefficace.

Cette approche s'inscrit dans une lutte plus large contre les « chaînes YouTube sans visage », qui utilisent des outils d'IA pour générer des contenus automatisés à partir de vidéos existantes. Les créateurs voient ainsi leurs travaux détournés et réutilisés à des fins lucratives sans leur consentement. La solution mise en place par F4mi repose sur plusieurs stratégies techniques sophistiquées : dissimulation de données parasites dans les sous-titres, utilisation de scripts Python pour masquer ces éléments et perturbation intentionnelle des résumeurs d'IA. Toutefois, cette méthode n'est pas sans limites. Les sous-titres modifiés posent des problèmes de compatibilité sur les applications mobiles, et certaines IA avancées comme Whisper d'OpenAI restent capables de transcrire efficacement l’audio, contournant ainsi le brouillage textuel. De plus, les utilisateurs rapportent des difficultés techniques, telles que des plantages d’appareils causés par la surcharge des sous-titres.



Au-delà de son impact immédiat, l’initiative de F4mi met en lumière un débat plus large sur la protection de la propriété intellectuelle face à l’essor des intelligences artificielles. Elle démontre comment les créateurs, confrontés à ces nouveaux défis, rivalisent d’ingéniosité pour défendre leur travail. Son approche pourrait inspirer d'autres solutions et amorcer une réflexion plus profonde sur la régulation et l’éthique des IA dans le domaine de la création de contenu.

Dissimulation et brouillage : une méthode pour protéger les vidéos des algorithmes

Le format Advanced SubStation Alpha (.ass) permet une personnalisation avancée du texte, incluant le positionnement, les polices, les couleurs et le formatage. F4mi en tire parti pour dissimuler des données parasites qui brouillent les outils de résumé de l'IA, tout en restant invisibles aux spectateurs humains. Le texte caché comprend des œuvres du domaine public modifiées ainsi que des scripts générés par l'IA, intégrant des informations fabriquées. Lorsqu'une IA tente d'exploiter ces transcriptions, le texte dissimulé perturbe l'extraction et fausse les résultats.

La mise en œuvre technique repose sur un système anti-scraping combinant plusieurs méthodes sophistiquées. F4mi a mis au point un script Python qui affiche des sous-titres inutiles sous forme de texte noir sur fond noir lors des transitions de scènes. Le système peut également brouiller des lettres individuelles en fonction d'horodatages précis, tout en maintenant un affichage cohérent pour les spectateurs. Bien que certains modèles d'IA avancés, comme ChatGPT, puissent filtrer certaines données parasites, la technique de brouillage complexifie leur tâche.

Cependant, cette approche présente certaines limites. Les sous-titres modifiés ne s'affichent pas correctement sur l'application mobile de YouTube, apparaissant sous forme de boîtes noires sur les vidéos. De plus, des utilisateurs ont signalé des plantages d’appareils causés par la surcharge du traitement des sous-titres. Par ailleurs, les IA qui transcrivent directement l’audio, comme Whisper d’OpenAI, restent capables d'extraire des informations précises, contournant ainsi le brouillage textuel. De même, les logiciels de lecture d'écran pourraient identifier et extraire les portions lisibles par l'humain.

Cette stratégie s'inscrit dans une lutte plus large contre la montée des « chaînes YouTube sans visage », qui exploitent l'IA pour générer des contenus automatisés à partir de vidéos existantes. Ces chaînes utilisent des outils d'intelligence artificielle pour produire des scripts, des voix off, des images et de la musique, souvent en s'appuyant sur des transcriptions récupérées et résumées par l'IA. Cette pratique soulève des préoccupations croissantes chez les créateurs quant à la protection de leur propriété intellectuelle.

Bien que la méthode de F4mi ne constitue pas une solution définitive contre le raclage de contenu par l'IA, elle illustre l'ingéniosité des créateurs dans leur quête pour protéger leur travail. Cette...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !