Adblock Radio est un bloqueur de publicité pour les flux radio en direct et les podcasts mis en place par Alexandre Storelli. Il veut aider les entreprises à développer des modèles économiques alternatifs et leur permettre d'offrir une meilleure expérience d'écoute aux amateurs de radio et de podcast qui ne veulent être dérangés par la publicité. D’après Storelli, Adblock Radio détecte les publicités audio grâce à l'apprentissage automatique et à d’autres techniques également utilisées par l'application de reconnaissance musicale Shazam. Il s’appuie aussi sur d’autres données comme l’empreinte acoustique.Adblock Radio est un bloqueur de publicité pour les flux radio en direct et les podcasts. Selon son auteur, Adblock Radio utilise des techniques comme la reconnaissance vocale, l'empreinte acoustique et l'apprentissage automatique pour détecter les formats de publicités. « Beaucoup de personnes n’aiment pas écouter la publicité à la radio. J'ai construit adblockradio.com pour permettre aux auditeurs de sauter les interruptions publicitaires sur leurs webradios préférées », a déclaré Alexandre Storelli à propos de son outil.
Le moteur de base d’Adblock Radio est open source. Ainsi, vous pouvez l’utiliser dans votre produit radio. Il utilise une base de données de publicités et une empreinte acoustique (un résumé numérique généré à partir d'un signal audio) qui convertit les caractéristiques audio en une série de chiffres qui peuvent être combinés par un algorithme. D’après ses explications, Adblock Radio utilise la même technologie qu’utilise Shazam pour identifier les chansons. Shazam, développé par l’entreprise Shazam Entertainment Limited basée à Londres, est un logiciel de reconnaissance musicale dédié aux chansons.
Pour bloquer les publicités dans un flux audio, Adblock Radio doit d’abord les détecter. Storelli a essayé plusieurs approches. Une première idée est de vérifier le volume sonore de l'audio, qui selon Storelli, est très bruyant. Les publicités reposent souvent sur la compression acoustique. Il estime que c’est un critère intéressant, mais il ne suffit pas de distinguer les annonces des autres contenus. Par exemple, cette stratégie fonctionnerait assez bien pour les stations de musique classique où les publicités sont le plus souvent plus fortes.
Par contre, ce ne serait pas le cas dans les radios de musique pop, où les chansons et les annonces sont aussi fortes que les publicités. De plus, certaines publicités sont tout à fait intentionnelles, de sorte qu'elles ne seraient pas détectées. Une autre idée est de considérer que les annonces sont diffusées à des heures fixes pour pouvoir utiliser la méthode baptisée « Fixed-time blocking » (blocage à temps fixe). D’après lui, c'est vrai dans une certaine mesure, mais cela manque de précision. Les stations de radio pourraient facilement vaincre cette stratégie décalant leurs programmes de quelques dizaines de secondes au hasard.
Une autre solution évidente serait de s'appuyer sur les métadonnées ICY/Shoutcast de la webradio, qui aident les logiciels comme VLC à afficher les informations sur le flux. Malheureusement, dans la plupart des cas, ces données sont brisées. Il serait possible de revenir à l'information en direct sur les sites Web radio, mais le plus souvent les annonces ne sont pas identifiées telles quelles. Storelli a précisé qu’en général, pendant la diffusion des publicités, le site Web affiche le nom de la chanson ou de l'émission qui a été diffusée auparavant.
En conclusion, cette stratégie n'est pas durable, car les radios peuvent très facilement changer ces métadonnées. Il a également tenté d’autres méthodes comme la reconnaissance vocale et l'analyse du champ lexical et la signalisation humaine. Plus tard, Storelli a choisi de se baser sur une base de données d'annonces, une méthode qu’il appelle la détection par empreintes numériques acoustiques. Cette méthode lui a permis d’obtenir la première version d'Adblock Radio en 2016. Cette version écoutait le flux en continu, à la recherche d'annonces.
D’après lui, une telle méthode était très prometteuse, mais la mise à jour de la base de données était difficile. La technique de recherche était la prise d'empreinte...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.