Gemini 2.0 Flash : L'IA générative de Google bouscule les limites éthiques, accessible à tous,

Elle soulève des questions sur la propriété intellectuelle et la désinformation

Le 22 mars 2025 à 04:02, par Bruno

90PARTAGES

Google a publié un nouveau modèle d'intelligence artificielle capable de générer ou de modifier des images aussi facilement qu'il crée du texte, dans le cadre d'une conversation avec un chatbot. Bien que les résultats ne soient pas encore parfaits, il est probable que, dans un avenir proche, cette technologie devienne accessible à tous. L'entreprise a élargi l'accès aux capacités natives de génération d'images de Gemini 2.0 Flash, en rendant cette fonctionnalité expérimentale disponible pour tous les utilisateurs de Google AI Studio. Jusqu'à présent réservée aux testeurs depuis décembre, cette technologie multimodale combine traitement du texte et des images au sein d'un même modèle d'intelligence artificielle.

Les utilisateurs des réseaux sociaux ont mis en lumière une utilisation controversée du nouveau modèle d'IA Gemini de Google : la suppression des filigranes sur des images, notamment celles publiées par Getty Images et d'autres banques d'images renommées.

New skill unlocked: Gemini 2 Flash model is really awesome at removing watermarks in images! pic.twitter.com/6QIk0FlfCv
— Deedy (@deedydas) March 15, 2025

La semaine dernière, Google a élargi l'accès à la fonction de génération d'images de son modèle Gemini 2.0 Flash, qui permet non seulement de créer, mais aussi de modifier des images de manière native. Bien que cette capacité soit impressionnante, elle semble manquer de garde-fous. En effet, Gemini 2.0 Flash peut générer des images de célébrités ou de personnages protégés par des droits d’auteur et, comme l'ont remarqué plusieurs utilisateurs, il est également capable de supprimer les filigranes des photos existantes.

Sur X et Reddit, plusieurs internautes ont signalé que le modèle ne se contente pas d’effacer les filigranes, mais tente aussi de recréer les zones sous-jacentes pour les rendre invisibles. Si d’autres outils d’intelligence artificielle offrent des fonctionnalités similaires, Gemini 2.0 Flash semble particulièrement efficace dans ce domaine, et son accès est gratuit.

[Tweet]<blockquote class="twitter-tweet"><p lang="en" dir="ltr">Gemini 2.0 Flash, available in Google's AI studio, is amazing at editing images with simple text prompts. <br><br>It also can remove watermarks from images (and puts its own subtle watermark in instead 🤣

<a href="https://t.co/ZnHTQJsT1Z">pic.twitter.com/ZnHTQJsT1Z</a></p>— Tanay Jaipuria (@tanayj) <a href="https://twitter.com/tanayj/status/1901362361476296858?ref_src=twsrc%5Etfw">March 16, 2025</a></blockquote> <script async src="https://platform.twitter.com/widgets.js" charset="utf-8"></script>[Tweet]

À noter que cette fonctionnalité de génération d’images est actuellement qualifiée d'« expérimentale » et « non destinée à la production », et qu’elle est uniquement disponible via les outils de développement de Google, comme AI Studio. Par ailleurs, le modèle ne parvient pas toujours à supprimer certains filigranes, notamment ceux qui sont semi-transparents ou qui couvrent une large partie de l’image.

Néanmoins, l'absence de restrictions sur cette utilisation risque de susciter l’indignation des détenteurs de droits d’auteur. D'autres modèles, comme Claude 3.7 Sonnet d’Anthropic et GPT-4o d’OpenAI, refusent explicitement d’exécuter cette tâche, considérant la suppression d’un filigrane comme « contraire à l’éthique et potentiellement illégale ». Aux États-Unis, retirer un filigrane sans l’autorisation du propriétaire est généralement illégal au regard de la loi sur le droit d’auteur, sauf exceptions spécifiques.

Interrogé sur la question, Google n’a pas répondu immédiatement aux demandes de commentaires faites en dehors des heures de bureau. Toutefois, un porte-parole de l’entreprise a déclaré : « L'utilisation des outils d'IA générative de Google pour enfreindre les droits d’auteur constitue une violation de nos conditions d'utilisation. Comme pour toutes les versions expérimentales, nous surveillons de près et écoutons les retours des développeurs. »

Google accélère l'IA avec Gemini 2.0 : innovation, agenticité et accessibilité

En décembre 2024, Google a lancé Gemini 2.0, un modèle d’intelligence artificielle promettant d’être plus rapide et plus performant grâce aux avancées en agenticité et aux capacités multimodales améliorées. Cette annonce est survenue peu après la sortie du modèle expérimental Gemini-Exp-1206, qui s’est rapidement hissé en tête du classement Chatbot Arena, surpassant GPT-4o d’OpenAI.

Sundar Pichai, PDG de Google et d'Alphabet, a souligné que l’organisation et l’accessibilité de l’information restent au cœur de la mission de l’entreprise. Avec Gemini 1.0 et 1.5, Google avait déjà fait des avancées significatives en matière de multimodalité, permettant au modèle de comprendre et traiter texte, vidéo, image, audio et code de manière plus approfondie. Aujourd’hui, des millions de développeurs utilisent Gemini pour réinventer les produits Google, notamment NotebookLM, qui exploite la multimodalité et le contexte long pour améliorer la productivité.

Avec Gemini 2.0, Google franchit une nouvelle étape en développant des modèles plus agentiques, capables de mieux comprendre leur environnement, d’anticiper des actions et d’agir sous la supervision des utilisateurs. Le modèle intègre désormais des sorties natives en image et en son, et s’accompagne d’une nouvelle fonctionnalité, Deep Research, qui exploite des capacités avancées de raisonnement pour compiler des rapports détaillés.

Google met Gemini 2.0 entre les mains des développeurs et des testeurs de confiance avant de l’intégrer progressivement dans ses produits phares comme Gemini et Search. La version expérimentale Gemini 2.0 Flash est désormais disponible pour tous les utilisateurs de Gemini.

L’IA joue également un rôle clé dans Search, où les aperçus d’IA permettent à plus d’un milliard de personnes de poser des questions plus complexes. Gemini 2.0 introduira des capacités de raisonnement avancées pour traiter des sujets plus complexes, y compris les équations mathématiques avancées, les requêtes multimodales et le codage.

L’amélioration de Gemini 2.0 repose sur des investissements massifs en IA, notamment avec Trillium, la puce TPU de sixième génération de Google, qui alimente entièrement l’entraînement et l’inférence des modèles Gemini. Désormais, Trillium est accessible aux clients, leur offrant une puissance de calcul IA avancée. Selon Sundar Pichai, si Gemini 1.0 était conçu pour organiser et comprendre l’information, Gemini 2.0 vise à la rendre encore plus utile.

Google mise sur l’IA pour booster la productivité des développeurs

En février 2025, Google a rendu accessible gratuitement Gemini Code Assist, un outil de codage assisté par IA, destiné aux développeurs du monde entier. Deux versions sont proposées : une pour les particuliers et une intégrée à GitHub. L’objectif est d’améliorer la productivité des développeurs, du simple étudiant au créateur de startup, sans contrainte de coût ou de restrictions d’usage. Cette annonce fait suite au lancement de Jules, un assistant d’IA capable de corriger des bogues de manière autonome et d’accélérer les cycles de développement grâce à Gemini 2.0.

D’après l’étude DORA de Google, 75 % des développeurs utilisent déjà l’IA dans leurs tâches quotidiennes. Chez Google, 25 % du nouveau code est généré par l’IA, avant d’être validé par les ingénieurs. Avec ces innovations, Google confirme sa volonté d’intégrer l’IA dans tous les aspects du développement logiciel et d’accélérer l’adoption des modèles génératifs dans l’industrie.

Comme l'ont fait remarquer plusieurs utilisateurs de X et de Reddit, Gemini 2.0 Flash ne se contente pas de supprimer les filigranes, mais tente également de combler les lacunes créées par la suppression d'un filigrane. D'autres outils dotés d'une intelligence artificielle le font également, mais Gemini 2.0 Flash semble être exceptionnellement compétent dans ce domaine, et son utilisation est gratuite.

Pour être clair, la fonction de génération d'images de Gemini 2.0 Flash est qualifiée d'« expérimentale » et de « non destinée à la production » pour le moment, et n'est disponible que dans les outils de Google destinés aux développeurs, comme AI Studio. Le modèle n'est pas non plus parfait pour supprimer les filigranes. Gemini 2.0 Flash semble avoir des difficultés avec certains filigranes semi-transparents et avec les filigranes qui recouvrent de grandes parties d'images.

Néanmoins, certains détenteurs de droits d'auteur ne manqueront pas de s'offusquer de l'absence de restrictions d'utilisation de Gemini 2.0 Flash. Certains modèles, dont le Claude 3.7 Sonnet d'Anthropic et le GPT-4o d'OpenAI, refusent explicitement de supprimer les filigranes ; Claude qualifie la suppression d'un filigrane d'une image de « contraire à l'éthique et potentiellement illégale ».

L’intelligence artificielle et la manipulation d’images : Où tracer la ligne rouge ?

L'émergence de Gemini 2.0 Flash souligne une avancée...

La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :

Identifiez-vous

Créer un compte

Gemini 2.0 Flash : L'IA générative de Google bouscule les limites éthiques, accessible à tous,

Elle soulève des questions sur la propriété intellectuelle et la désinformation

Identifiant
Mot de passe

Mot de passe oublié ?

Identifiez-vous

Créer un compte

Gemini 2.0 Flash : L'IA générative de Google bouscule les limites éthiques, accessible à tous, Elle soulève des questions sur la propriété intellectuelle et la désinformation

Gemini 2.0 Flash : L'IA générative de Google bouscule les limites éthiques, accessible à tous,

Elle soulève des questions sur la propriété intellectuelle et la désinformation