
basé sur des outils d'apprentissage automatique
Adblock Radio est un bloqueur de publicité pour les flux radio en direct et les podcasts mis en place par Alexandre Storelli. Il veut aider les entreprises à développer des modèles économiques alternatifs et leur permettre d'offrir une meilleure expérience d'écoute aux amateurs de radio et de podcast qui ne veulent être dérangés par la publicité. D’après Storelli, Adblock Radio détecte les publicités audio grâce à l'apprentissage automatique et à d’autres techniques également utilisées par l'application de reconnaissance musicale Shazam. Il s’appuie aussi sur d’autres données comme l’empreinte acoustique.
Adblock Radio est un bloqueur de publicité pour les flux radio en direct et les podcasts. Selon son auteur, Adblock Radio utilise des techniques comme la reconnaissance vocale, l'empreinte acoustique et l'apprentissage automatique pour détecter les formats de publicités. « Beaucoup de personnes n’aiment pas écouter la publicité à la radio. J'ai construit adblockradio.com pour permettre aux auditeurs de sauter les interruptions publicitaires sur leurs webradios préférées », a déclaré Alexandre Storelli à propos de son outil.
Le moteur de base d’Adblock Radio est open source. Ainsi, vous pouvez l’utiliser dans votre produit radio. Il utilise une base de données de publicités et une empreinte acoustique (un résumé numérique généré à partir d'un signal audio) qui convertit les caractéristiques audio en une série de chiffres qui peuvent être combinés par un algorithme. D’après ses explications, Adblock Radio utilise la même technologie qu’utilise Shazam pour identifier les chansons. Shazam, développé par l’entreprise Shazam Entertainment Limited basée à Londres, est un logiciel de reconnaissance musicale dédié aux chansons.
Pour bloquer les publicités dans un flux audio, Adblock Radio doit d’abord les détecter. Storelli a essayé plusieurs approches. Une première idée est de vérifier le volume sonore de l'audio, qui selon Storelli, est très bruyant. Les publicités reposent souvent sur la compression acoustique. Il estime que c’est un critère intéressant, mais il ne suffit pas de distinguer les annonces des autres contenus. Par exemple, cette stratégie fonctionnerait assez bien pour les stations de musique classique où les publicités sont le plus souvent plus fortes.
Par contre, ce ne serait pas le cas dans les radios de musique pop, où les chansons et les annonces sont aussi fortes que les publicités. De plus, certaines publicités sont tout à fait intentionnelles, de sorte qu'elles ne seraient pas détectées. Une autre idée est de considérer que les annonces sont diffusées à des heures fixes pour pouvoir utiliser la méthode baptisée « Fixed-time blocking » (blocage à temps fixe). D’après lui, c'est vrai dans une certaine mesure, mais cela manque de précision. Les stations de radio pourraient facilement vaincre cette stratégie décalant leurs programmes de quelques dizaines de secondes au hasard.
Une autre solution évidente serait de s'appuyer sur les métadonnées ICY/Shoutcast de la webradio, qui aident les logiciels comme VLC à afficher les informations sur le flux. Malheureusement, dans la plupart des cas, ces données sont brisées. Il serait possible de revenir à l'information en direct sur les sites Web radio, mais le plus souvent les annonces ne sont pas identifiées telles quelles. Storelli a précisé qu’en général, pendant la diffusion des publicités, le site Web affiche le nom de la chanson ou de l'émission qui a été diffusée auparavant.
En conclusion, cette stratégie n'est pas durable, car les radios peuvent très facilement changer ces métadonnées. Il a également tenté d’autres méthodes comme la reconnaissance vocale et l'analyse du champ lexical et la signalisation humaine. Plus tard, Storelli a choisi de se baser sur une base de données d'annonces, une méthode qu’il appelle la détection par empreintes numériques acoustiques. Cette méthode lui a permis d’obtenir la première version d'Adblock Radio en 2016. Cette version écoutait le flux en continu, à la recherche d'annonces.
D’après lui, une telle méthode était très prometteuse, mais la mise à jour de la base de données était difficile. La technique de recherche était la prise d'empreinte acoustique, similaire à ce que Shazam fait sur ses serveurs lorsqu'il s'agit d'identifier une chanson. Un type d'algorithme qui est communément appelé landmark. La prise d'empreintes numériques est pertinente pour détecter les publicités parce que les publicités sont diffusées de façon identique plusieurs fois. Pour la même raison, il peut aussi détecter la musique.
Toutefois, cette technique ne fonctionnerait pas pour les publicités natives parce que les gens ne prononcent jamais les mots exactement de la même façon. La version suivante de l’algorithme va se baser sur la classification acoustique entre publicité, conversation et musique à l’aide de l’apprentissage automatique. L’algorithme d’Adblock Radio analysait le contenu acoustique des émissions de radio : les sons graves et aigus et leurs variations dans le temps. Selon Storelli, il s'agit d'une méthode plus sophistiquée pour surveiller l'intensité sonore.
Il a utilisé pour cela, des outils d'apprentissage automatique, plus précisément la bibliothèque Keras connectée à Tensorflow. Cela aurait donné de très bons résultats, utilisant peu de ressources informatiques. Avec cette méthode, la distinction entre la parole et la musique s'est avérée accessible, de sorte que la classification est devenue plus précise. Pour finalement obtenir un résultat plus convaincant, Storelli a procédé à la combinaison de la classification acoustique et de l'appariement des empreintes numériques.
Pour plus de fiabilité, la version la plus fiable d’Adblock Radio combine les concepts des deux tentatives précédentes : la classification acoustique et la base de données audio. Selon Storelli, le prédicteur d'apprentissage automatique, s'il est correctement formé, fournit des classifications correctes sur la plupart des contenus originaux, mais il échoue dans certaines situations qui feront l’objet d’une amélioration dans le futur. Le rôle du module de comparaison d'empreintes numériques est d'éviter les erreurs du module d'apprentissage automatique.
D’après Storelli, à l’heure actuelle, la détection n'est pas parfaite pour certains types de contenu audio comme la musique hip-hop, les publicités pour des émissions-débats, etc., et les publicités natives. Ces derniers constituent le cas où le locuteur régulier lit le contenu sponsorisé. Ceci est assez inhabituel sur les radios, bien que plus commun dans les podcasts. Storelli a expliqué que la prochaine étape logique de son bloqueur consistera à utiliser un logiciel de reconnaissance vocale pour tenter de résoudre cet aspect. De même, la radio analogique n'est pas encore supportée par Adblock Radio. Les signaux analogiques (FM) n'ont pas été testés et ne sont pas pris en charge actuellement. Storelli estime que le bruit analogique pourrait annuler les techniques utilisées.
Storelli déconseille l’exécution d’Adblock Radio dans le cloud. « Adblock Radio devrait idéalement être exécuté sur le périphérique de l'utilisateur final. Mais il est à la mode de faire les calculs dans le cloud et de servir les résultats aux auditeurs. Adblock Radio a testé deux options pour concevoir une architecture avec ce paradigme. L...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.