IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Adblock Radio : un bloqueur de publicité qui marche sur les podcasts et la radio
Basé sur des outils d'apprentissage automatique

Le , par Bill Fassinou

45PARTAGES

5  0 
Adblock Radio est un bloqueur de publicité pour les flux radio en direct et les podcasts mis en place par Alexandre Storelli. Il veut aider les entreprises à développer des modèles économiques alternatifs et leur permettre d'offrir une meilleure expérience d'écoute aux amateurs de radio et de podcast qui ne veulent être dérangés par la publicité. D’après Storelli, Adblock Radio détecte les publicités audio grâce à l'apprentissage automatique et à d’autres techniques également utilisées par l'application de reconnaissance musicale Shazam. Il s’appuie aussi sur d’autres données comme l’empreinte acoustique.

Adblock Radio est un bloqueur de publicité pour les flux radio en direct et les podcasts. Selon son auteur, Adblock Radio utilise des techniques comme la reconnaissance vocale, l'empreinte acoustique et l'apprentissage automatique pour détecter les formats de publicités. « Beaucoup de personnes n’aiment pas écouter la publicité à la radio. J'ai construit adblockradio.com pour permettre aux auditeurs de sauter les interruptions publicitaires sur leurs webradios préférées », a déclaré Alexandre Storelli à propos de son outil.

Le moteur de base d’Adblock Radio est open source. Ainsi, vous pouvez l’utiliser dans votre produit radio. Il utilise une base de données de publicités et une empreinte acoustique (un résumé numérique généré à partir d'un signal audio) qui convertit les caractéristiques audio en une série de chiffres qui peuvent être combinés par un algorithme. D’après ses explications, Adblock Radio utilise la même technologie qu’utilise Shazam pour identifier les chansons. Shazam, développé par l’entreprise Shazam Entertainment Limited basée à Londres, est un logiciel de reconnaissance musicale dédié aux chansons.

Pour bloquer les publicités dans un flux audio, Adblock Radio doit d’abord les détecter. Storelli a essayé plusieurs approches. Une première idée est de vérifier le volume sonore de l'audio, qui selon Storelli, est très bruyant. Les publicités reposent souvent sur la compression acoustique. Il estime que c’est un critère intéressant, mais il ne suffit pas de distinguer les annonces des autres contenus. Par exemple, cette stratégie fonctionnerait assez bien pour les stations de musique classique où les publicités sont le plus souvent plus fortes.

Par contre, ce ne serait pas le cas dans les radios de musique pop, où les chansons et les annonces sont aussi fortes que les publicités. De plus, certaines publicités sont tout à fait intentionnelles, de sorte qu'elles ne seraient pas détectées. Une autre idée est de considérer que les annonces sont diffusées à des heures fixes pour pouvoir utiliser la méthode baptisée « Fixed-time blocking » (blocage à temps fixe). D’après lui, c'est vrai dans une certaine mesure, mais cela manque de précision. Les stations de radio pourraient facilement vaincre cette stratégie décalant leurs programmes de quelques dizaines de secondes au hasard.


Une autre solution évidente serait de s'appuyer sur les métadonnées ICY/Shoutcast de la webradio, qui aident les logiciels comme VLC à afficher les informations sur le flux. Malheureusement, dans la plupart des cas, ces données sont brisées. Il serait possible de revenir à l'information en direct sur les sites Web radio, mais le plus souvent les annonces ne sont pas identifiées telles quelles. Storelli a précisé qu’en général, pendant la diffusion des publicités, le site Web affiche le nom de la chanson ou de l'émission qui a été diffusée auparavant.

En conclusion, cette stratégie n'est pas durable, car les radios peuvent très facilement changer ces métadonnées. Il a également tenté d’autres méthodes comme la reconnaissance vocale et l'analyse du champ lexical et la signalisation humaine. Plus tard, Storelli a choisi de se baser sur une base de données d'annonces, une méthode qu’il appelle la détection par empreintes numériques acoustiques. Cette méthode lui a permis d’obtenir la première version d'Adblock Radio en 2016. Cette version écoutait le flux en continu, à la recherche d'annonces.

D’après lui, une telle méthode était très prometteuse, mais la mise à jour de la base de données était difficile. La technique de recherche était la prise d'empreinte acoustique, similaire à ce que Shazam fait sur ses serveurs lorsqu'il s'agit d'identifier une chanson. Un type d'algorithme qui est communément appelé landmark. La prise d'empreintes numériques est pertinente pour détecter les publicités parce que les publicités sont diffusées de façon identique plusieurs fois. Pour la même raison, il peut aussi détecter la musique.

Toutefois, cette technique ne fonctionnerait pas pour les publicités natives parce que les gens ne prononcent jamais les mots exactement de la même façon. La version suivante de l’algorithme va se baser sur la classification acoustique entre publicité, conversation et musique à l’aide de l’apprentissage automatique. L’algorithme d’Adblock Radio analysait le contenu acoustique des émissions de radio : les sons graves et aigus et leurs variations dans le temps. Selon Storelli, il s'agit d'une méthode plus sophistiquée pour surveiller l'intensité sonore.

Il a utilisé pour cela, des outils d'apprentissage automatique, plus précisément la bibliothèque Keras connectée à Tensorflow. Cela aurait donné de très bons résultats, utilisant peu de ressources informatiques. Avec cette méthode, la distinction entre la parole et la musique s'est avérée accessible, de sorte que la classification est devenue plus précise. Pour finalement obtenir un résultat plus convaincant, Storelli a procédé à la combinaison de la classification acoustique et de l'appariement des empreintes numériques.

Pour plus de fiabilité, la version la plus fiable d’Adblock Radio combine les concepts des deux tentatives précédentes : la classification acoustique et la base de données audio. Selon Storelli, le prédicteur d'apprentissage automatique, s'il est correctement formé, fournit des classifications correctes sur la plupart des contenus originaux, mais il échoue dans certaines situations qui feront l’objet d’une amélioration dans le futur. Le rôle du module de comparaison d'empreintes numériques est d'éviter les erreurs du module d'apprentissage automatique.

D’après Storelli, à l’heure actuelle, la détection n'est pas parfaite pour certains types de contenu audio comme la musique hip-hop, les publicités pour des émissions-débats, etc., et les publicités natives. Ces derniers constituent le cas où le locuteur régulier lit le contenu sponsorisé. Ceci est assez inhabituel sur les radios, bien que plus commun dans les podcasts. Storelli a expliqué que la prochaine étape logique de son bloqueur consistera à utiliser un logiciel de reconnaissance vocale pour tenter de résoudre cet aspect. De même, la radio analogique n'est pas encore supportée par Adblock Radio. Les signaux analogiques (FM) n'ont pas été testés et ne sont pas pris en charge actuellement. Storelli estime que le bruit analogique pourrait annuler les techniques utilisées.

Storelli déconseille l’exécution d’Adblock Radio dans le cloud. « Adblock Radio devrait idéalement être exécuté sur le périphérique de l'utilisateur final. Mais il est à la mode de faire les calculs dans le cloud et de servir les résultats aux auditeurs. Adblock Radio a testé deux options pour concevoir une architecture avec ce paradigme. L'expérience de première main montre que ce n'est pas une solution idéale, pour des raisons techniques et juridiques », a-t-il expliqué. Vous pouvez en savoir à ce sujet en consultant la note de version d’Adblock Radio.

Adblock Radio est aussi livré en tant que SDK open source. « Mon premier objectif est de rendre Adblock Radio compatible avec tous les appareils d'écoute, en tant que SDK », a-t-il déclaré. Le code est open source et tout le monde peut aider à l'intégrer. Actuellement, il est encore un peu difficile d'installer et d'utiliser Adblock Radio seul. D’un autre côté, Adblock Radio peut s'intégrer dans des haut-parleurs intelligents, des applications mobiles, des extensions de navigateur et même des systèmes modernes de sonorisation automobile (Apple, Car Play, Android Auto, Mirrorlink...).

Enfin, Storelli a révélé qu'en 2016, il a reçu des menaces d'avocats de la part d’une radio privée française pour des motifs présumés de violation du droit d'auteur et de la marque. Ainsi, faute de moyens financiers pour se défendre sérieusement, Storelli a retiré certains flux du site adbblockradio.com, fermé partiellement le site et modifié l'architecture du système. Le groupe de radios aurait refusé d'entamer une collaboration pour trouver un terrain d'entente. Cela a également amené la station de radio à surveiller le site Web de Storelli.

« Depuis lors, j'ai pu constater à travers l'analyse du trafic qu'ils ont continué à surveiller mon site Web et ont consulté leurs avocats », a-t-il déclaré. Selon lui, les publicités exploitent les faiblesses de beaucoup d'âmes sans défense et que pouvoir les bloquer sera un soulagement pour beaucoup de personnes. Néanmoins, Storelli a assuré que son objectif n’est pas que les radios cessent leurs activités ou que les créateurs cessent de créer, mais de créer une expérience de diffusion en continu qui vaut la peine d’être payée et qui fera baisser le taux de publicités intrusives.

« Personne ne veut que nos radios préférées cessent leurs activités ou que les créateurs cessent de créer. Les artistes et les éditeurs ont besoin de notre soutien financier. La vision à long terme d'Adblock Radio est de créer de nouvelles expériences pour la diffusion en continu qui vaudront la peine d'être payées, afin que les artistes soient payés et que la publicité ne soit plus nécessaire », a-t-il conclu.

Source : Adblock Radio

Et vous ?

Qu'en pensez-vous ?

Voir aussi

La part de marché de Firefox augmente pour la deuxième fois consécutive en 2 mois. Le navigateur libre pourrait-il survivre auprès de Chrome ?

Les extensions contenant du code masqué seront désormais interdite sur Firefox, d'après une MàJ des conditions d'utilisation destinée aux développeurs

Les listes de filtres Adblock Plus peuvent exécuter du code arbitraire dans les pages Web. L'éditeur retire l'option de filtre $rewrite par précaution

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de Steph82
Membre actif https://www.developpez.com
Le 27/09/2019 à 13:21
Intéressant, on aurait penser qu'il suffisait de se baser sur le volume sonore (ça marcherait surement mieux sur les pubs TV vu qu'elles sont tout le temps plus forte et on ne fait que baisser le volume pendant ces spots). Pour contrer le système, il ne reste plus qu'a faire des pubs avec un fond musicale et a les chanter
0  0 
Avatar de sebbod
Membre averti https://www.developpez.com
Le 27/09/2019 à 14:58
Je teste depuis 11h ce matin.
Première pub sur france-inter vers 12h, elle n'a pas été détecté donc j'ai cliquez sur le drapeau.
La suivante par contre l'a été cool,

NB : Mais en même temps elle était difficile a détecter car c'est 2 personnes qui parlent d'un produit style question/réponse sur le ton d'une interview (pas du tout un format classique de pub même moi au début je ne m'étais pas rendu compte que s'en était une merde ils sont fort les fabricants de pubs).

C'est paradoxale car je déteste me bouffer des pubs et pourtant j'adorerais en cuisiner pour influencer les masses
0  0