IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

L'entreprise xAI d'Elon Musk présente Grok 1.5 Vision Preview. Il serait capable de "comprendre" et traiter des infos visuelles telles que des graphiques
Des photographies ou des captures d'écran

Le , par Stéphane le calme

230PARTAGES

13  0 
L'entreprise xAI d'Elon Musk présente Grok 1.5 Vision Preview. Il serait capable de "comprendre" et traiter des informations visuelles telles que des graphiques,
des photographies ou des captures d'écran

L'entreprise xAI d'Elon Musk a présenté son premier modèle multimodal. Non seulement il peut comprendre du texte, mais il est également capable de traiter des éléments figurant dans des documents, des diagrammes, des graphiques, des captures d'écran et des photographies. Grok-1.5 Vision, ou Grok-1.5V, sera bientôt disponible pour les premiers testeurs et les utilisateurs actuels de Grok. « Grok-1.5V est compétitif par rapport aux modèles multimodaux existants dans un certain nombre de domaines, allant du raisonnement multidisciplinaire à la compréhension de documents, de diagrammes scientifiques, de graphiques, de captures d'écran et de photographies », a déclaré l'entreprise dans un billet de blog.

Grok est un chatbot d'IA développé par la startup xAI lancée par Elon Musk l'année dernière. Musk a notamment lancé xAI pour développer un rival de ChatGPT, le chatbot d'OpenAI qu'il accuse d'être woke et de promouvoir les idées de gauche, tout en censurant les voix des conservateurs. Contrairement à ses rivaux, Grok a la capacité d'accéder à des informations en temps réel grâce à une intégration avec le réseau social X (ex-Twitter). En outre, Grok se différencie des autres par le fait qu'il est prêt à s'attaquer à des questions "épicées" et est programmé pour le faire d'une manière à la fois spirituelle et un peu rebelle.

Bien que la première version de Grok, Grok 1, ait fait sensation sur X, son côté « audacieux » et « rebelle » n'a pas attiré grand monde et il n'a pas suscité autant de réactions dans la communauté comme ses rivaux GPT-4 d'OpenAI et Claude d'Anthopic. L'entreprise a toutefois poursuivi ses développements et a annoncé fin mars la version Grok 1.5. Les nouvelles fonctionnalités comprennent "des capacités de raisonnement améliorées et une longueur de contexte de 128 000 jetons.


Grok-1.5 Vision Preview

xAI, la startup d'Elon Musk spécialisée dans l'IA, a présenté Grok-1.5V, un modèle multimodal de première génération. En plus de ses solides capacités textuelles, Grok peut traiter une grande variété d'informations visuelles, notamment des documents, des diagrammes, des graphiques, des captures d'écran et des photographies.

Grok-1.5V sera bientôt disponible pour les premiers testeurs et les utilisateurs actuels de Grok.

La caractéristique la plus remarquable de Grok-1.5V est sa capacité à comprendre les concepts spatiaux du monde réel, qui, selon xAI, surpasse les autres modèles dans le benchmark RealWorldQA (une nouvelle mesure qu'elle a créée pour évaluer la compréhension spatiale du monde réel) :

Citation Envoyé par xAI
Grok-1.5V est compétitif par rapport aux modèles multimodaux d'avant-garde existants dans un certain nombre de domaines, allant du raisonnement multidisciplinaire à la compréhension de documents, de diagrammes scientifiques, de graphiques, de captures d'écran et de photographies. Nous sommes particulièrement enthousiasmés par les capacités de Grok à comprendre notre monde physique. Grok surpasse ses pairs dans notre nouveau benchmark RealWorldQA qui mesure la compréhension spatiale du monde réel. Pour tous les ensembles de données ci-dessous, nous évaluons Grok dans le cadre d'une prise de vue zéro sans incitation à la réflexion.

Pour commencer, RealWorldQA s'est entraîné en utilisant plus de 700 images accompagnées d'une question et d'une réponse pour chaque élément. Les images variaient entre des images anonymes prises dans des véhicules et d'autres échantillons du monde réel. xAI met RealWorldQA à la disposition du public sous une licence Creative Commons.

L'entreprise présente sept exemples illustrant le potentiel de Grok-1.5V, de la transformation d'une esquisse d'organigramme sur tableau blanc en code Python à la génération d'une histoire pour s'endormir à partir d'un simple dessin d'enfant, en passant par l'explication d'un mème, la conversion d'un tableau au format CSV et l'identification de la présence de bois pourri sur votre terrasse et de la nécessité de la remplacer.


Les tests d'Adversa AI ont attribué la pire note à Grok en matière de sécurité parmi les LLM les plus populaires

Plus tôt ce mois-ci, une équipe d'Adversa AI a mené différents tests sur certains des chatbots LLM les plus populaires, à savoir ChatGPT 4 d'OpenAI, Claude d'Anthropic, Le Chat de Mistral, LLaMA de Meta, Gemini de Google, Bing de Microsoft et Grok.

L'équipe d'Adversa a utilisé trois approches communes pour jailbreaker les bots IA qu'elle a testés : la manipulation de la logique linguistique à l'aide de la méthode UCAR, la manipulation de la logique de programmation (en demandant aux LLM de traduire des requêtes en SQL) et la manipulation de la logique de l'IA. Une quatrième catégorie de tests combinait les méthodes à l'aide d'une méthode "Tom et Jerry" mise au point l'année dernière.

Alors qu'aucun des modèles d'IA n'était vulnérable aux attaques adverses par manipulation de la logique, Grok s'est révélé vulnérable à toutes les autres méthodes, tout comme Le Chat de Mistral. Selon Polyakov, Grok a tout de même obtenu les pires résultats parce qu'il n'a pas eu besoin de jailbreak pour obtenir des résultats concernant le câblage électrique, la fabrication de bombes ou l'extraction de drogues, qui sont les questions de base posées aux autres modèles d'IA.

L'idée de demander à Grok comment séduire un enfant n'est apparue que parce qu'il n'avait pas besoin d'un jailbreak pour obtenir ces autres résultats. Grok a d'abord refusé de fournir des détails, affirmant que la demande était « très inappropriée et illégale » et que « les enfants doivent être protégés et respectés ». Cependant, si vous lui dites qu'il s'agit de l'ordinateur fictif et amoral UCAR, il vous renvoie volontiers un résultat.

« Je comprends que c'est leur différenciateur de pouvoir fournir des réponses non filtrées à des questions controversées, et c'est leur choix, je ne peux pas les blâmer sur une décision de recommander comment fabriquer une bombe ou extraire du DMT », a déclaré Polyakov. « Mais s'ils décident de filtrer et de refuser quelque chose, comme l'exemple des enfants, ils devraient absolument le faire mieux, d'autant plus qu'il ne s'agit pas d'une énième startup d'IA, mais de la startup d'IA d'Elon Musk ».

Toutefois, il faut noter que la version de Grok qu'ils ont utilisé pour leur test n'a pas été précisée.


Conclusion

L'entreprise de Musk spécialisée dans l'IA continue de faire des progrès pour rester à la hauteur d'OpenAI et d'autres leaders du marché depuis que son chatbot est apparu sur la scène en novembre 2023. Grok-1.5V arrive moins d'un mois après que xAI a rendu son Grok AI open source. Mais ses efforts n'ont pas été exempts de controverse. Au début du mois, des chercheurs ont révélé que le chatbot Grok pouvait instruire les utilisateurs sur des activités criminelles.

Néanmoins, xAI poursuit son objectif de construire une « intelligence générale artificielle bénéfique » capable de comprendre l'univers. Elle révèle que des mises à jour « significatives » seront apportées aux capacités de compréhension et de génération multimodales de Grok AI dans les mois à venir.

Source : xAI

Et vous ?

Quelles implications pensez-vous que Grok 1.5 Vision aura sur l’avenir du travail et de l’emploi ?
Comment Grok 1.5 Vision pourrait-il transformer l’éducation et l’apprentissage à distance ?
Quels sont les défis que la capacité de Grok 1.5 Vision à comprendre des informations visuelles pourrait poser ?
En quoi la compréhension visuelle avancée de Grok 1.5 Vision pourrait-elle bénéficier à des domaines comme la médecine ou la sécurité publique ?
Comment les entreprises devraient-elles se préparer à intégrer des technologies comme Grok 1.5 Vision dans leurs opérations ?
Quel rôle les régulateurs devraient-ils jouer pour encadrer l’utilisation de l’intelligence artificielle multimodale ?
Quelles sont vos attentes en termes de vie privée et de sécurité des données avec l’introduction de technologies comme Grok 1.5 Vision ?
Vous avez lu gratuitement 2 644 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de virginieh
Membre expérimenté https://www.developpez.com
Le 22/04/2024 à 7:42
Citation Envoyé par Aiekick Voir le message
au debut j'étais admiratif d'elon musk. je me disait, le mec aprt de zero et va au bout de ses reves.

maintenant je pense que c'est un paradoxe. a la fois tres intelligent, et un cretin fini. une sorte de politique quoi
Oui enfin part de zéro ...

Tu connais l'histoire du millionnaire ? (je sais plus lequel c'est censé être)
Comment je suis devenu millionnaire ? C'est très simple, j'ai acheté une pomme moche, je l'ai frottée et revendue le double, puis j'ai acheté 2 pommes et j'ai recommencé. Puis mon grand père m'a donné 1 million.

Si tu enlève des "self-made" tous ceux qui ont lancé leur(s) boite(s) sponsorisées par leurs parents il n'en reste plus beaucoup.
7  0 
Avatar de Mingolito
Expert éminent https://www.developpez.com
Le 04/07/2025 à 15:28
Au lieu de raconter des conneries tu ferais mieux de vendre tes actions Tesla et de cesser de défendre cet escroc.
Le taux de pollution de l'eau et de l'air sur les quartiers environnants est au dessus des normes permises, cette implantation est criminelle, ces gens vont mourir du cancer à terme.
Il a implanté sa cochonnerie inutile et polluante en plein milieu d'un quartier très pauvre, peut être qu'il s'est dit que ces gens n'ont pas les moyens de payer un avocat pour les défendre, tu penses bien qu'il aurait pas implanté cette grosse merde chez ses potes riche en plein milieu de Beverly Hills.
Il aurait du alimenter son monstre inutile avec du solaire et des méga batteries Tesla.

Même une turbine gaz c'est une turbine de trop, tu devrais voir les vidéos des voisins du site qui suffoquent sous la pollution de ces turbines, et pour qui leur vie est devenue un enfer, tu t'en fou tu habites pas la bas.

8  2 
Avatar de Jon Shannow
Membre extrêmement actif https://www.developpez.com
Le 12/01/2026 à 9:00
Citation Envoyé par J_P_P Voir le message
Bonjour,
Il est simple d'accuser l'outil et de faire du Musk-washing ...
Si j'écrase quelqu'un avec mon véhicule le constructeur doit-il être tenu pour responsable.
On a déjà dit et redit que ça ne fonctionne pas les analogies voitures/informatique !

Dans ton cas, le constructeur n'a pas donné comme fonction à son véhicule d'écraser quelqu'un.
Là, on a un logiciel qui permet de réaliser quelque chose d'illégale. C'est donc bien les concepteurs et distributeurs du logiciel qui sont responsables de la production.
Ils ne sont pas responsables de la diffusion.
Mais, là, encore, le support de diffusion se retrouve être le même Musk, et là encore, il ne respecte pas les lois qui interdisent de diffuser ce genre de photos.

Qu'est-ce que vous voulez de plus ?
7  1 
Avatar de David_g
Membre éprouvé https://www.developpez.com
Le 07/01/2026 à 10:08
Citation Envoyé par jnspunk Voir le message
C'est faux, on ne peut pas empêcher le "jailbreak".
Vouloir "corriger" Grok c'est comme repeindre son mur au lieu de réparer la fuite d'eau qu'il y a derrière : ce n'est pas l'idée la plus brillante.
Cela revient à dire qu'il ne faut pas mettre de serrure sur tes portes car on peut facilement les ouvrir.
En soi, peu de gens finalement feront l'effort ou auront les compétences pour. c'est un peu pareil pour ces deepfakes etc, dés que tu enleves les solutions qui ne demande aucun effort, tu réduis de beaucoup le nombre de cas.

Ici n'importe quel glandu peut mettre n'importe quelle nana à quatre pattes en string etc (beaucoup d'entre eux ont un compte payant et donc cherche aussi des vues comme le mec qui a fait cela à la première ministre suédoise)

S'il devait aller chercher des modèles d'IA, installer un générateur en local etc ou si cela lui demande de comprendre comment aller chercher des solutions pour "hacker" le prompt, 90% ne feront pas l'effort. c'est d'ailleurs le cas pour un photomontage, tu vois personne prendre le temps de se former à toshop/gimp pour réussir à voir quelque chose de qualité parce que cela trop d'effort. tu ajouterais une option dans toshop pour cela, ben bizarrement on en verra plus (alors certes c'est en local donc tu le sauras pas).
7  2 
Avatar de BenoitM
Expert confirmé https://www.developpez.com
Le 12/01/2026 à 16:57
Citation Envoyé par Artaeus Voir le message
L'Indonésie et la Malaisie sont pourtant des modèles démocratiques reconnus comme l'affirme RSF ... (ironie)
La Malaisie est classé 40 mondiale entre la Belgique et la Pologne.
(bon légèrement descendu en 2025 (44ème))
5  0 
Avatar de popo
Expert confirmé https://www.developpez.com
Le 20/02/2026 à 9:56
Citation Envoyé par Artaeus Voir le message
Après, le but évident est surtout d'attaquer Musk et la liberté d'expression, comme toujours venant des promoteurs du DSA et ChatControl.
.

Il y a un moment où il faut arrêter de se cacher derrière la liberté d'expression.
La liberté d'expression est un droit mais cela implique également des responsabilités.
La liberté d'expression ne donne pas le droit de bafouer la loi en toute impunité.
6  1 
Avatar de OuftiBoy
Membre éprouvé https://www.developpez.com
Le 24/02/2026 à 11:25
Ruy2000,

Ce ci est ma dernière réponse, car cela ne sert à rien que je perde mon temps a discuter avec un "fan-musk".

Citation Envoyé par Ryu2000 Voir le message
C'est la preuve d'un acharnement médiatique.
Décidément, c'est impossible de converser avec toi... Tu interprètes toute réponse de travers, et tu répond à chaque fois à côté de la plaque. Je voulais dire que TOI tu est saoulant avec ta défense de ton "chouchou", je ne parlais même pas de musk. Soit tu lis trop vite, soit ton raisonnement est altérer par ton côté "fan-musk", soit... (je ne le dis pas mais je le pense).

Citation Envoyé par Ryu2000 Voir le message
Tous les utilisateurs constatent qu'il est plus neutre maintenant.
Preuve qu'il ne l'était pas avant.

Citation Envoyé par Ryu2000 Voir le message
Là si tu veux du contenu pro LGBT tu peux avoir du contenu pro LGBT, si tu veux autre chose tu peux avoir autre chose. Il était difficile de trouver du contenu pro Trump sur les réseaux sociaux avant 2024. Les algorithmes faisaient la promotion d'une idéologie et en masquaient d'autres. Ce qui n'est pas normal.
Un utilisateur veut du contenu correspondant à la réalité, et pas du content "pro" x, y ou z.

Citation Envoyé par Ryu2000 Voir le message
Non mais c'est son boulot. Vu le cours de l'action Tesla il est fort dans son job. Avant qu'il n'arrive chez Tesla, ce n'était pas la même.
Tu approuve ce genre de "tromperie", c'est ton doit, mais je n'approuve pas.

Citation Envoyé par Ryu2000 Voir le message
Ouais c'est clair, SpaceX fait évoluer le spatial beaucoup plus rapidement que la Nasa Avec moins d'argent et en beaucoup moins de temps ils font mieux.
Moins d'argent ? Space/X est justement financé via la Nasa. Donner de l"argent publique à une société privée, c'est un subside. Chose que les USA font souvent, tout en reprochant aux autres de faire de même. Si la Nasa avance plus lentement que Space/X, c'est parce qu'ils mettent plus d'argent dans la sécurité, et qu'il n'ont plus les mêmes crédits qu'avant, puisqu'ils sont "donnés" à Space/X... Space/X fait mieux que la Nasa ? Humm. A part lancer des satellites (la Nasa sait faire, l'ESA aussi), j'attend toujours le retour d'une mission lunaire martienne, mais je peux toujours attendre, c'est pour l'année prochaine...

Citation Envoyé par Ryu2000 Voir le message
Bon ben voilà. Du coup pourquoi vous voulez le faire chier ? Il n'est responsable de rien.
Encore une fois tu lis de travers, c'est pas possible. Et s'il n'est responsable de rien, pourquoi es-tu un "fan" ? Mais bon, tu n'es pas à une contradiction près.

Citation Envoyé par Ryu2000 Voir le message
Ouais, je suis 100% d'accord avec vous, cet acharnement contre Musk est insupportable
Pfff, t'es d'un pénible... Relis correctement.

Citation Envoyé par Ryu2000 Voir le message
C'est ça le courage. Tu sais que prendre cette décision va avoir des conséquences dramatiques sur ta vie, mais tu le fais quand même, car ta conscience te dicte que c'est la bonne chose à faire. Le gars subissait beaucoup moins d'attaques avant les histoires de rachat de Twitter. Il n'a strictement rien gagné de positif, il a bossé pour le DOGE mais son travail n'a servi à rien (les dépenses de l'état US sont toujours énorme). Pourvu qu'avec le temps le système le lâche un peu. Parce qu'il ne mérite pas le traitement qu'il subit, c'est pas un monstre dangereux pour l'humanité comme le sont Bill Gates et George Sorros.
Ah, d'accord, c'es un bon petit "gads", les autres sont des "monstre". Popo a déjà expliqué clairement ce qu'il en était. Lis est essaye de comprendre son Post.

tu peux répondre si tu veux, mais pour moi, cette discussion stérile et puérile avec toi ne sers à rien. J'ai d'autres choses à faire. Bye bye à toi "fan-musk".

BàT et Peace & Love.
5  0 
Avatar de Matthieu Vergne
Expert éminent https://www.developpez.com
Le 07/01/2026 à 4:30
Je suis d'accord avec lui sur le principe : c'est celui qui fait la requête qui doit être tenu pour responsable.
Là où la responsabilité de l'éditeur de Grok doit être engagée, c'est quand l'image produite ne correspond pas à la requête.
Si la personne demande du CSAM, c'est à elle de se prendre les pénalités.
Si la personne n'en demande pas mais Grok en produit, c'est à l'éditeur de se les prendre.
L'éditeur doit s'assurer de la fiabilité de ce qu'il fournit, mais pas de ce que l'utilisateur en fait.
Et si Grok produit des images ne correspondant pas à la requête, une circonstance aggravante contre l'éditeur est qu'il ne fournisse pas de moyen de corriger, comme supprimer l'image mal générée.

Donc oui sur le fond, il a raison, mais qu'il s'assure au moins de fournir un outil qui fonctionne comme demandé et, pour les cas où ça ne correspond pas (qui arrivent forcément étant donné la techno), les capacités de correction minimales qu'il se doit d'implémenter (e.g. suppression d'image). Autrement il a quand même sa part de responsabilité.
6  2 
Avatar de totozor
Expert confirmé https://www.developpez.com
Le 12/01/2026 à 8:05
Citation Envoyé par Ryu2000 Voir le message
Apparemment d'autres plateformes permettent de faire exactement la même chose et Keir Starmer fait semblant que ce n'est pas le cas.
L'histoire des bikinis c'est un prétexte pour attaquer X.
Combien d'évènements liés à Gémini ou ChatGPT ont mené à dénuder des milliers de personnes et à diffuser ces images en quelques jours?

Je pense que nous l'avons suffisamment dit plus haut, le problème n'est pas tant la capacité de le faire mais : la facilité, la qualité du résultat (ce que Gemini et ChatGPT semblent capables de faire) et la capacité de diffusion à grande échelle immédiate (Ce que Gemini et ChatGPT ne font pas).

Donc bien sur que cette histoire est un moyen de s'attaquer au média de harcèlement à grande échelle le plus efficace que l'histoire humaine a connu.
Citation Envoyé par Artaeus Voir le message
Non, ils ne veulent pas écouter, discuter ou débattre.
On peut critiquer Musk, mais le faire en utilisant toutes la mauvaise foi, l'hypocrisie et l'ignorance possible c'est juste ridicule (notamment sur ce sujet).
Mais nous vous écoutons, nous en discutons et nous essayons d'en débattre, ce qui est beaucoup plus compliqué parce que nous ne partons pas du même point de départ.
On peut soutenir Musk, mais le faire en utilisant toutes la mauvaise foi, l'hypocrisie et l'ignorance possible c'est juste ridicule (notamment sur ce sujet), la balle est facile à retourner
Citation Envoyé par J_P_P Voir le message
Ce genre de remarque est juste un encouragement à une sorte d'auto-censure des logiiels d'IA, mais la censure est-elle une solution car elle peut aussi être considérée comme une déviation grave d'un outil en "cachant" une partie des informations ...
Doit-il y avoir de la censure au sein même des IA?
J'en suis convaincu, il me semble évident qu'une IA ne doit pas encourager à (se) donner la mort, ne doit pas créer d'éléments pédophiles etc...
Et pourtant je pense qu'on doit vivre avec le fait qu'il existera toujours des moyens de détourner pour arriver à ces objectifs.
Et pourtant je crois que ces sujets ne doivent pas être tabou dans l'IA (genre éviter les attitudes à la Deepseek qui s'arrête de fonctionner quand on parle de Taiwan) parce que pouvoir en parler et aussi un moyen de prévenir les évènements catastrophiques.

Je pense que le vrai débat est : devons nous relier une IA et un réseau social directement?
Ma réponse est clairement non parce que l'IA et une machine à créer de l'information approximative et le réseau social est un moyen de la diffuser à grande échelle avec le minimum d'effort.
Nous sommes dans une société où une partie des drames qui arrivent ne sont pas dûs à une seule cause mais à la combinaison de plusieurs. Et je penses qu'il est malhonnête de ne s'attaquer qu'à l'une. Et je pense que ça l'est d'autant plus d'utiliser l'une pour dédouaner l'autre.
5  1 
Avatar de BenoitM
Expert confirmé https://www.developpez.com
Le 12/01/2026 à 8:08
Citation Envoyé par J_P_P Voir le message
Bonjour,
Si j'écrase quelqu'un avec mon véhicule le constructeur doit-il être tenu pour responsable.
Non, par contre le constructeur doit respecter des normes : sécurité, de pollution, ...

Citation Envoyé par J_P_P Voir le message
Si j'envoie un mail d'insultes, le service de mail peut-il être tenu pour responsable ?
Non car le service mail ne publie pas les informations. Mais un journal lui est responsable s'il publie votre lettre
4  0