IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Gemini 2.0 Flash : L'IA générative de Google bouscule les limites éthiques, accessible à tous,
Elle soulève des questions sur la propriété intellectuelle et la désinformation

Le , par Bruno

36PARTAGES

5  0 
Google a publié un nouveau modèle d'intelligence artificielle capable de générer ou de modifier des images aussi facilement qu'il crée du texte, dans le cadre d'une conversation avec un chatbot. Bien que les résultats ne soient pas encore parfaits, il est probable que, dans un avenir proche, cette technologie devienne accessible à tous. L'entreprise a élargi l'accès aux capacités natives de génération d'images de Gemini 2.0 Flash, en rendant cette fonctionnalité expérimentale disponible pour tous les utilisateurs de Google AI Studio. Jusqu'à présent réservée aux testeurs depuis décembre, cette technologie multimodale combine traitement du texte et des images au sein d'un même modèle d'intelligence artificielle.

Les utilisateurs des réseaux sociaux ont mis en lumière une utilisation controversée du nouveau modèle d'IA Gemini de Google : la suppression des filigranes sur des images, notamment celles publiées par Getty Images et d'autres banques d'images renommées.

La semaine dernière, Google a élargi l'accès à la fonction de génération d'images de son modèle Gemini 2.0 Flash, qui permet non seulement de créer, mais aussi de modifier des images de manière native. Bien que cette capacité soit impressionnante, elle semble manquer de garde-fous. En effet, Gemini 2.0 Flash peut générer des images de célébrités ou de personnages protégés par des droits d’auteur et, comme l'ont remarqué plusieurs utilisateurs, il est également capable de supprimer les filigranes des photos existantes.

Sur X et Reddit, plusieurs internautes ont signalé que le modèle ne se contente pas d’effacer les filigranes, mais tente aussi de recréer les zones sous-jacentes pour les rendre invisibles. Si d’autres outils d’intelligence artificielle offrent des fonctionnalités similaires, Gemini 2.0 Flash semble particulièrement efficace dans ce domaine, et son accès est gratuit.

[Tweet]<blockquote class="twitter-tweet"><p lang="en" dir="ltr">Gemini 2.0 Flash, available in Google's AI studio, is amazing at editing images with simple text prompts. <br><br>It also can remove watermarks from images (and puts its own subtle watermark in instead 🤣 <a href="https://t.co/ZnHTQJsT1Z">pic.twitter.com/ZnHTQJsT1Z</a></p>— Tanay Jaipuria (@tanayj) <a href="https://twitter.com/tanayj/status/1901362361476296858?ref_src=twsrc%5Etfw">March 16, 2025</a></blockquote> <script async src="https://platform.twitter.com/widgets.js" charset="utf-8"></script>[Tweet]

À noter que cette fonctionnalité de génération d’images est actuellement qualifiée d'« expérimentale » et « non destinée à la production », et qu’elle est uniquement disponible via les outils de développement de Google, comme AI Studio. Par ailleurs, le modèle ne parvient pas toujours à supprimer certains filigranes, notamment ceux qui sont semi-transparents ou qui couvrent une large partie de l’image.

Néanmoins, l'absence de restrictions sur cette utilisation risque de susciter l’indignation des détenteurs de droits d’auteur. D'autres modèles, comme Claude 3.7 Sonnet d’Anthropic et GPT-4o d’OpenAI, refusent explicitement d’exécuter cette tâche, considérant la suppression d’un filigrane comme « contraire à l’éthique et potentiellement illégale ». Aux États-Unis, retirer un filigrane sans l’autorisation du propriétaire est généralement illégal au regard de la loi sur le droit d’auteur, sauf exceptions spécifiques.

Interrogé sur la question, Google n’a pas répondu immédiatement aux demandes de commentaires faites en dehors des heures de bureau. Toutefois, un porte-parole de l’entreprise a déclaré : « L'utilisation des outils d'IA générative de Google pour enfreindre les droits d’auteur constitue une violation de nos conditions d'utilisation. Comme pour toutes les versions expérimentales, nous surveillons de près et écoutons les retours des développeurs. »

Google accélère l'IA avec Gemini 2.0 : innovation, agenticité et accessibilité

En décembre 2024, Google a lancé Gemini 2.0, un modèle d’intelligence artificielle promettant d’être plus rapide et plus performant grâce aux avancées en agenticité et aux capacités multimodales améliorées. Cette annonce est survenue peu après la sortie du modèle expérimental Gemini-Exp-1206, qui s’est rapidement hissé en tête du classement Chatbot Arena, surpassant GPT-4o d’OpenAI.

Sundar Pichai, PDG de Google et d'Alphabet, a souligné que l’organisation et l’accessibilité de l’information restent au cœur de la mission de l’entreprise. Avec Gemini 1.0 et 1.5, Google avait déjà fait des avancées significatives en matière de multimodalité, permettant au modèle de comprendre et traiter texte, vidéo, image, audio et code de manière plus approfondie. Aujourd’hui, des millions de développeurs utilisent Gemini pour réinventer les produits Google, notamment NotebookLM, qui exploite la multimodalité et le contexte long pour améliorer la productivité.

Avec Gemini 2.0, Google franchit une nouvelle étape en développant des modèles plus agentiques, capables de mieux comprendre leur environnement, d’anticiper des actions et d’agir sous la supervision des utilisateurs. Le modèle intègre désormais des sorties natives en image et en son, et s’accompagne d’une nouvelle fonctionnalité, Deep Research, qui exploite des capacités avancées de raisonnement pour compiler des rapports détaillés.

Google met Gemini 2.0 entre les mains des développeurs et des testeurs de confiance avant de l’intégrer progressivement dans ses produits phares comme Gemini et Search. La version expérimentale Gemini 2.0 Flash est désormais disponible pour tous les utilisateurs de Gemini.

L’IA joue également un rôle clé dans Search, où les aperçus d’IA permettent à plus d’un milliard de personnes de poser des questions plus complexes. Gemini 2.0 introduira des capacités de raisonnement avancées pour traiter des sujets plus complexes, y compris les équations mathématiques avancées, les requêtes multimodales et le codage.

L’amélioration de Gemini 2.0 repose sur des investissements massifs en IA, notamment avec Trillium, la puce TPU de sixième génération de Google, qui alimente entièrement l’entraînement et l’inférence des modèles Gemini. Désormais, Trillium est accessible aux clients, leur offrant une puissance de calcul IA avancée. Selon Sundar Pichai, si Gemini 1.0 était conçu pour organiser et comprendre l’information, Gemini 2.0 vise à la rendre encore plus utile.

Google mise sur l’IA pour booster la productivité des développeurs

En février 2025, Google a rendu accessible gratuitement Gemini Code Assist, un outil de codage assisté par IA, destiné aux développeurs du monde entier. Deux versions sont proposées : une pour les particuliers et une intégrée à GitHub. L’objectif est d’améliorer la productivité des développeurs, du simple étudiant au créateur de startup, sans contrainte de coût ou de restrictions d’usage. Cette annonce fait suite au lancement de Jules, un assistant d’IA capable de corriger des bogues de manière autonome et d’accélérer les cycles de développement grâce à Gemini 2.0.

D’après l’étude DORA de Google, 75 % des développeurs utilisent déjà l’IA dans leurs tâches quotidiennes. Chez Google, 25 % du nouveau code est généré par l’IA, avant d’être validé par les ingénieurs. Avec ces innovations, Google confirme sa volonté d’intégrer l’IA dans tous les aspects du développement logiciel et d’accélérer l’adoption des modèles génératifs dans l’industrie.

Comme l'ont fait remarquer plusieurs utilisateurs de X et de Reddit, Gemini 2.0 Flash ne se contente pas de supprimer les filigranes, mais tente également de combler les lacunes créées par la suppression d'un filigrane. D'autres outils dotés d'une intelligence artificielle le font également, mais Gemini 2.0 Flash semble être exceptionnellement compétent dans ce domaine, et son utilisation est gratuite.

Pour être clair, la fonction de génération d'images de Gemini 2.0 Flash est qualifiée d'« expérimentale » et de « non destinée à la production » pour le moment, et n'est disponible que dans les outils de Google destinés aux développeurs, comme AI Studio. Le modèle n'est pas non plus parfait pour supprimer les filigranes. Gemini 2.0 Flash semble avoir des difficultés avec certains filigranes semi-transparents et avec les filigranes qui recouvrent de grandes parties d'images.

Néanmoins, certains détenteurs de droits d'auteur ne manqueront pas de s'offusquer de l'absence de restrictions d'utilisation de Gemini 2.0 Flash. Certains modèles, dont le Claude 3.7 Sonnet d'Anthropic et le GPT-4o d'OpenAI, refusent explicitement de supprimer les filigranes ; Claude qualifie la suppression d'un filigrane d'une image de « contraire à l'éthique et potentiellement illégale ».

L’intelligence artificielle et la manipulation d’images : Où tracer la ligne rouge ?

L'émergence de Gemini 2.0 Flash souligne une avancée...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de Camille12
Nouveau Candidat au Club https://www.developpez.com
Le 25/03/2025 à 12:41
Gemini 2.0 marque un bond en avant impressionnant pour l'IA, avec des performances accrues et une vitesse remarquable. La multimodalité et les capacités agentiques ouvrent des perspectives passionnantes, notamment pour les développeurs. La concurrence avec OpenAI s'intensifie, et c'est une excellente nouvelle pour l'innovation. Vivement les retours des testeurs !
0  0