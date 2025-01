DeepMind has ambitious plans to make massive generative models that simulate the world. I'm hiring for a new team with this mission. Come build with us!https://t.co/pqvALtAvLs https://t.co/vtwgeXl9Dl — Tim Brooks (@_tim_brooks) January 6, 2025

On the critical path to AGI. https://t.co/4Zuju5eMHb — Logan Kilpatrick (@OfficialLoganK) January 6, 2025

Mais les créateurs ont des sentiments mitigés à l'égard de cette technologie

Quand les droits d’auteur s’opposent aux ambitions de l’intelligence artificielle

Bien que ces technologies promettent des avancées dans des domaines tels que le divertissement, la simulation et l'entraînement pour robots, elles suscitent également des débats. Les critiques soulignent les implications éthiques, économiques et juridiques, notamment concernant la perte d'emplois, les droits d'auteur, et les limites des modèles dans la représentation précise du monde réel.Alors que Google s'efforce de transformer ces défis en opportunités, cette initiative s'inscrit dans une compétition croissante avec d'autres entreprises visant à créer des modèles mondiaux capables de révolutionner les médias interactifs et les simulations réalistes.Tim Brooks, l'un des responsables du générateur vidéo Sora d'OpenAI, qui a quitté le laboratoire de recherche en IA de Google, Google DeepMind, en octobre, dirigera la nouvelle équipe, a-t-il annoncé dans un message sur X. Cette équipe fera partie de Google DeepMind. « DeepMind a des projets ambitieux pour créer des modèles génératifs massifs qui simulent le monde », a écrit Brooks lundi matin. « Je recrute pour une nouvelle équipe chargée de cette mission.Selon les offres d'emploi que Brooks a mises en lien dans son message, la nouvelle équipe de modélisation collaborera avec les équipes Gemini, Veo et Genie de Google et s'appuiera sur leurs travaux pour s'attaquer à de « nouveaux problèmes critiques » et mettre à l'échelle les modèles « aux niveaux de calcul les plus élevés ». Gemini est la série phare de modèles d'IA de Google pour des tâches telles que l'analyse d'images et la génération de texte, tandis que Veo est le propre modèle de génération de vidéos de Google.Quant à Genie, il s'agit de la version de Google d'un modèle mondial - une IA capable de simuler des jeux et des environnements 3D en temps réel. Le dernier modèle Genie de Google, présenté en décembre, peut générer une grande variété de mondes 3D jouables.« Nous pensons que la mise à l'échelle [de la formation à l'IA] sur des données vidéo et multimodales est sur le chemin critique de l'intelligence artificielle générale », peut-on lire dans l'une des descriptions de poste. L'intelligence artificielle générale, ou AGI, désigne généralement l'IA capable d'accomplir n'importe quelle tâche humaine. « Les modèles mondiaux alimenteront de nombreux domaines, tels que le raisonnement visuel et la simulation, la planification pour les agents incarnés et le divertissement interactif en temps réel.Selon la description, la nouvelle équipe de Brooks cherchera à développer des outils de « génération interactive en temps réel » à partir des modèles qu'elle construit, et étudiera comment intégrer ses modèles aux modèles multimodaux existants tels que Gemini.Un certain nombre de startups et de grandes entreprises technologiques sont à la recherche de modèles mondiaux, notamment World Labs de l'influent chercheur en IA Fei-Fei Lee, l'entreprise israélienne Decart et Odyssey. Ces entreprises estiment que les modèles de monde pourraient un jour être utilisés pour créer des médias interactifs, tels que des jeux vidéo et des films, et pour réaliser des simulations réalistes telles que des environnements d'entraînement pour les robots.Une récente enquête de Wired a révélé que des studios de jeux comme Activision Blizzard, qui a licencié de nombreux travailleurs, utilisent l'IA pour réduire les coûts, augmenter la productivité et compenser les départs. Une étude réalisée en 2024 à la demande de l'Animation Guild, un syndicat représentant les animateurs et les dessinateurs d'Hollywood, estime que plus de 100 000 emplois américains dans les domaines du cinéma, de la télévision et de l'animation seront perturbés par l'IA d'ici à 2026.Certaines startups du secteur naissant de la modélisation mondiale, comme Odyssey, se sont engagées à collaborer avec les professionnels de la création, et non à les remplacer. Nous verrons bien si Google leur emboîte le pas. Il y a aussi la question non résolue des droits d'auteur. Certains modèles de monde semblent avoir été formés à partir de séquences de jeux vidéo, ce qui pourrait faire des entreprises qui développent ces modèles la cible de poursuites judiciaires dans les cas où les vidéos n'ont pas été autorisées.Google, propriétaire de YouTube, affirme qu'il a l'autorisation d'entraîner ses modèles sur des vidéos YouTube, conformément aux conditions d'utilisation de la plateforme. Mais l'entreprise n'a pas précisé quelles vidéos spécifiques elle utilise pour l'entraînement.L’initiative de Google DeepMind pour développer des modèles d’intelligence artificielle capables de simuler le monde physique soulève des enjeux cruciaux qui méritent une analyse approfondie. Si cette avancée technologique promet des bénéfices considérables, comme la création de mondes interactifs pour le divertissement, la formation de robots ou encore la simulation de scénarios complexes, elle n’est pas sans controverse.D’un point de vue technique, ces modèles cherchent à reproduire ou à imiter des aspects du monde physique, mais avec des limites inhérentes. Les critiques pointent notamment l’impossibilité pratique de simuler le monde réel avec une précision absolue, en raison des contraintes de calcul et des simplifications nécessaires. Par ailleurs, la distinction entre « simulation » et « intuition statistique », souvent confondue, doit être clarifiée. Ce débat soulève des questions sur la manière dont ces modèles IA appréhendent et reproduisent la réalité, et si cette approche est suffisante pour répondre aux attentes des utilisateurs ou des développeurs.Sur le plan économique et social, l’impact sur les emplois est préoccupant. L’automatisation de tâches créatives ou techniques pourrait entraîner des pertes massives dans des secteurs tels que l’animation ou la production audiovisuelle, bien que certains y voient une opportunité de réinventer ces industries. La collaboration avec les créateurs humains, comme le promettent certaines startups, pourrait être une voie d’équilibre, mais reste à concrétiser dans des pratiques équitables.Enfin, les questions éthiques et juridiques, notamment sur l’utilisation de données protégées par des droits d’auteur pour entraîner ces modèles, posent des défis majeurs. L’opacité sur les sources de données utilisées alimente des tensions et pourrait conduire à des litiges, notamment si des contenus protégés sont exploités sans autorisation explicite.En résumé, bien que cette initiative soit un jalon significatif dans la recherche en intelligence artificielle, elle illustre aussi la nécessité d’un cadre de gouvernance rigoureux pour gérer les impacts sociaux, éthiques et juridiques. La quête d’une "simulation du monde" doit s’accompagner d’une réflexion sur la manière dont ces technologies transforment nos sociétés, pour s’assurer qu’elles servent des objectifs collectifs et responsables.Source : Tim Brooks on XQuel est votre avis sur le sujet ?Faut-il encadrer le développement de ces modèles d’IA à l’échelle internationale pour prévenir les abus ou les dérives ?Dans quelle mesure la concurrence avec d’autres entreprises, comme Odyssey ou Decart, pourrait-elle accélérer ou freiner l’innovation dans ce domaine ?