"Nous avons essayé d'exclure les ensembles de données qui ont une forte prépondérance d'informations personnelles", a déclaré Nick Clegg, président des affaires mondiales de Meta, à Reuters lors de la conférence Meta Connect qui s'est tenue cette semaine. Clegg ajoute que la "grande majorité" des données utilisées par Meta pour former ses assistants d'intelligence artificielle sont accessibles au public.
En début de semaine, Meta a annoncé une ligne de chatbots IA sur ses plateformes de messagerie, notamment WhatsApp, Instagram et Messenger. Le chatbot peut aider à répondre à des questions, à planifier des voyages et à générer des images à partir de textes. L'assistant sera également en mesure de fournir des résultats en temps réel à partir de la recherche Bing de Microsoft.
Le modèle de Meta est basé en partie sur son modèle de langage LLaMA 2, publié en juillet.
En plus de son assistant général, l'entreprise déploie 28 personnages dotés d'IA sur ses plateformes de messagerie, dont certains sont inspirés de célébrités telles que Snoop Dogg, Kendall Jenner et Tom Brady. Les chatbots ont été lancés en version bêta limitée mercredi, mais ne sont pas encore accessibles au grand public.
De nombreuses entreprises se sont récemment retrouvées sous le feu des critiques pour avoir utilisé du contenu web pour entraîner leur IA sans l'autorisation de l'auteur ou de l'artiste d'origine. C'est notamment le cas de xAI d'Elon Musk, qui prévoit d'entraîner son IA à partir de tweets, ce qui a incité les artistes qui partagent leur contenu sur Twitter à menacer de quitter le site.
Source : Reuters
Et vous ?
Quel est votre avis sur le sujet ?
Que pensez-vous de l'utilisation de vos données publiques pour l'entrainement de l'IA ?
Voir aussi :
Meta lance un outil d'IA appelé Code Llama capable de générer du code informatique et de déboguer le code écrit par un programmeur, mais les critiques affirment que ces outils ne sont pas fiables
Meta met à disposition son modèle d'intelligence artificielle et de langage étendu, Llama 2 pour une utilisation commerciale par le biais de partenariats avec Microsoft
Google indique qu'il va utiliser tout ce que vous allez publier en ligne comme données d'entraînement de son IA dans une mise à jour de sa politique de confidentialité