IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Des scientifiques espèrent accélérer le développement de l'AGI avec un réseau de supercalculateurs dont le premier nœud sera bientôt déployé,
Mais le projet suscite le scepticisme et plusieurs préoccupations

Le , par Mathis Lucas

32PARTAGES

3  0 
Des scientifiques espèrent accélérer le développement de l'AGI avec un réseau de supercalculateurs dont le premier nœud sera bientôt déployé
mais le projet suscite le scepticisme et plusieurs préoccupations

Des scientifiques de SingularityNET espèrent accélérer le développement de l'intelligence artificielle générale (AGI) à l'aide d'un réseau de superordinateurs. L'objectif de l'entreprise est d'établir "un réseau d'informatique cognitive à plusieurs niveaux" qui hébergera et formera les architectures nécessaires à l'AGI. Les superordinateurs intégreront des éléments de systèmes d'IA avancés comme les réseaux neuronaux profonds, les LLM et des systèmes multimodaux qui relient les comportements humains aux sorties multimédias. Le premier supercalculateur sera mis en service prochainement, mais son achèvement est prévu pour la fin 2024 ou le début 2025.

Un grand réseau de supercalculateurs visant à accélérer le développement de l'AGI

L'AGI est un concept futuriste qui vise à concevoir une machine dotée d'une cognition de niveau humain et capable d'autodidacte. L'objectif est que le logiciel soit capable d'effectuer des tâches pour lesquelles il n'est pas nécessairement formé ou développé. L'AGI une avancée significative par rapport aux systèmes d'IA actuels qui excellent dans des domaines spécifiques sur la base de leurs données d'apprentissage, mais peinent à accomplir des tâches cognitives ou de raisonnement dans d'autres domaines. Par exemple, les modèles d'IA entraînés à la génération d'image ne sont pas capables de créer des sites Web.


En théorie, l'AGI peut résoudre des problèmes complexes dans des situations et des contextes qui ne lui ont pas été enseignés au moment de sa création. Cependant, l'industrie encore est loin de cette révolution en raison de plusieurs défis qu'elle peine à relever. Et pour accélérer les choses, l'entreprise d'IA SingularityNET a annoncé qu'elle s'apprête à déployer un réseau de superordinateurs. SingularityNET est une plateforme décentralisée basée sur la blockchain qui vise à créer un marché mondial pour les services d'IA. Elle a été lancée en 2017 par Ben Goertzel, mathématicien et chercheur américain en IA.

Mais l'initiative suscite le scepticisme. Précédemment, Yann LeCun, lauréat du prestigieux prix Turing et responsable de l'IA chez Meta, a déclaré que l'AGI est inévitable, mais qu'elle n'arrivera pas l'année prochaine et qu'elle ne sera pas uniquement l'œuvre des LLM. Pour lui, ces modèles d'IA ne sont pas en mesure de résoudre les défis cognitifs tels que le raisonnement, la planification, la mémoire persistante et la compréhension du monde physique. En outre, certains critiques pensent que l'industrie peut augmenter la puissance de calcul à sa guise, mais que cela ne suffit pas de créer une machine capable de penser par elle-même.

Citation Envoyé par Critique


Ils peuvent s'assurer que le matériel existe et qu'il est suffisamment puissant pour l'AGI, bien sûr. Cependant, la partie sur laquelle nous sommes toujours bloqués n'est pas la puissance de traitement brute, mais comment faire pour créer quelque chose qui pense par lui-même.

Les systèmes d'IA dont nous disposons aujourd'hui n'en sont même pas proches, et si l'on considère la façon dont ils fonctionnent sous le capot, je dirai qu'ils ne constituent même pas un pas dans la bonne direction.

Les superordinateurs développés par SingularityNET intégreront des éléments de systèmes d'IA avancés. Il s'agit notamment des réseaux neuronaux profonds, des grands modèles de langage (LLM) et des systèmes multimodaux qui relient les comportements humains, tels que la parole et les mouvements, aux sorties multimédias. Le tout premier superordinateur devrait être mis en service prochainement, mais son achèvement est prévu pour la fin 2024 ou le début 2025, en fonction des délais de livraison des fournisseurs. Il s'agira d'un supercalculateur modulaire qui intégrera de nombreux composants de pointe.

Ces composants comprennent : des processeurs graphiques (GPU) L40S de Nvidia, des processeurs Instinct et Genoa d'AMD, des baies de serveurs Tenstorrent Wormhole dotées de GPU H200 de Nvidia, ainsi que des systèmes Blackwell GB200 de Nvidia. L'ensemble constitue l'un des matériels d'IA les plus puissants disponibles sur le marché. Ces composants font partie du matériel le plus puissant disponible aujourd'hui pour la formation et l'inférence des modèles d'IA.

Un framework open source pour faciliter le développement d'une superintelligence

« Ce supercalculateur constituera en soi une percée dans la transition vers l'AGI. Bien que les nouvelles approches d'IA neuronale-symbolique développées par l'équipe d'IA de SingularityNET réduisent quelque peu les besoins en données, en traitement et en énergie par rapport aux réseaux neuronaux profonds standard, nous avons toujours besoin d'importantes installations de supercalculateurs », a déclaré Ben Goertzel, cofondateur et PDG de SingularityNET.

SingularityNET vise à fournir un accès aux données pour la croissance de l'AGI et d'une future superintelligence artificielle, un système hypothétique beaucoup plus avancé cognitivement que n'importe quel humain. Pour ce faire, SingularityNET a développé un logiciel unique appelé "OpenCog Hyperon" pour gérer le cluster de calcul fédéré (distribué). « OpenCog Hyperon est un logiciel libre conçu spécifiquement pour l'architecture des systèmes d'IA. Cette nouvelle infrastructure matérielle est spécialement conçue pour mettre en œuvre OpenCog Hyperon et son écosystème AGI », a déclaré Goertzel.

Pour permettre aux utilisateurs d'accéder au superordinateur, Goertzel et son équipe utilisent un système de jetons, courant dans le domaine de l'IA. Les utilisateurs ont accès au supercalculateur et, grâce à leurs jetons, ils peuvent utiliser et ajouter des données aux ensembles existants sur lesquels les autres utilisateurs s'appuient pour tester et déployer les concepts de l'AGI. Dans leur forme la plus simple, les jetons d'IA imitent les jetons des jeux vidéo autonomes des salles d'arcade. Les joueurs devaient acheter des jetons qu'ils inséraient ensuite dans le jeu vidéo pour obtenir un certain nombre de chances de jouer.

Dans ce cas, les données collectées en jouant au jeu sont accessibles à tous les autres joueurs, non seulement dans une salle d'arcade, mais aussi dans les autres salles d'arcade du monde entier. « Le GPT-3 a été entraîné sur 300 milliards de jetons (généralement des mots, des parties de mots ou des signes de ponctuation), et le GPT-4 sur 13 000 milliards », a laissé entendre Nabeel S. Qureshi, chercheur au sein du think tank Mercatus et ingénieur en logiciel.

Lors d'une conférence en 2018, Goertzel a déclaré : « je ne pense pas que nous ayons besoin d'algorithmes fondamentalement nouveaux. Je pense que nous devons connecter nos algorithmes d'une manière différente de ce que nous faisons aujourd'hui. Si j'ai raison, alors nous avons déjà les algorithmes de base dont nous avons besoin. Je pense que nous sommes à moins de dix ans de la création d'une IA de niveau humain ». Une prédiction audacieuse qui suscite le scepticisme.

Cependant, il est loin d'être le seul à faire ce type de déclaration audacieuse. Shane Legg, cofondateur de Google DeepMind, a déclaré que l'IA pourrait atteindre ou dépasser l'intelligence humaine d'ici 2028. Mark Mark Zuckerberg, PDG de Meta, poursuit activement l'AGI en investissant 10 milliards de dollars dans la construction de l'infrastructure nécessaire à la formation de modèles d'IA avancés en janvier. Meta envisage même de décupler sa puissance de calcul.

Les réseaux électriques n'étaient pas préparés à la croissance subite de la demande

La création de ce réseau de superordinateurs met en lumière la demande croissante d'une immense puissance de calcul pour la recherche sur l'IA. Bien que le projet en soit encore à ses débuts, le déploiement du premier nœud constitue une étape importante. Si le projet est couronné de succès, ce réseau pourrait devenir l'épine dorsale de la recherche sur l'AGI, en fournissant l'infrastructure nécessaire pour relever certains des défis les plus complexes dans ce domaine. Cependant, l'impact climatique de cette nouvelle infrastructure potentiellement énergivore suscite de profondes préoccupations.

La croissance rapide de l'IA a fait grimper la demande en énergie à un niveau plus élevé que ce qui était prévu. Aux États-Unis, elle mettrait déjà à rude épreuve les capacités de production du pays. Grid Strategies estime que les prévisions de croissance sur neuf ans pour l'Amérique du Nord ont pratiquement doublé par rapport à l'année dernière, car les entreprises construisent des centres de données pour l'IA qui font paraître minuscules les besoins des centres de données traditionnels. Où cela nous mène-t-il ? Comment pouvons-nous naviguer dans un avenir énergétique durable avec l'explosion de l'utilisation de l'IA ?

Aux États-Unis, les analystes rapportent que les réseaux électriques atteignent peu à peu leur limite. L'année dernière, les prévisions à cinq ans de Grid Strategies tablaient sur une croissance de 2,6 %. Depuis, ce chiffre a presque doublé pour atteindre 4,7 % et les planificateurs de Grid Strategies s'attendent à ce que la demande de pointe augmente de 38 gigawatts. Cela équivaut à la quantité nécessaire pour alimenter 12,7 millions de foyers, soit un peu plus que le nombre total d'unités d'habitation au Texas. Mais plus inquiétant encore, les analystes pensent que ce chiffre est probablement une sous-estimation des besoins réels.

L'IA est un élément majeur du problème en ce qui concerne l'augmentation de la demande. Les leaders du secteur, comme OpenAI, Amazon, Microsoft et Google, construisent ou recherchent des sites où construire d'énormes centres de données pour héberger l'infrastructure nécessaire au développement de grands modèles de langage, et les entreprises plus petites du secteur sont également très demandeuses d'énergie. Par exemple, selon l'Agence internationale de l'énergie, "une recherche pilotée par ChatGPT consomme environ 10 fois plus d'électricité qu'une recherche sur le moteur de recherche Google".

La consommation annuelle d'énergie d'un centre de données de Meta basé dans l'Iowa est équivalente à celle de 7 millions d'ordinateurs portables fonctionnant huit heures par jour. L'appétit énergétique de l'IA remet aussi en question les engagements en faveur du climat. La résurgence de l'énergie fossile dans les centres de données pour répondre aux besoins de l'IA contraste fortement avec les engagements de durabilité des entreprises comme Microsoft, Google et Meta.

Elles prévoient de supprimer entièrement leurs émissions d'ici à 2030. Cependant, l'IA remet en question ces initiatives. Ces entreprises sont les acteurs les plus importants d'une constellation de plus de 2 700 centres de données à travers les États-Unis. Et la construction de nouveaux centres de données est envisagée.

Source : SingularityNET

Et vous ?

Quel est votre avis sur le sujet ?
Que pensez-vous du réseau de superordinateurs annoncé par SingularityNET ?
Cette infrastructure va-t-il accélérer le développement de l'AGI comme le prétend SingularityNET ?

Voir aussi

« La bulle de la GenAI n'éclatera pas, car les applications à haute valeur ajoutée arriveront assez vite pour éviter que les PDG des Big Tech ne s'épuisent sur la GenAI », affirme l'expert en IA Ben Goertzel

Si l'humanité parvient à franchir le goulot d'étranglement que constitue la sécurité de l'AGI, on pourrait entrer dans une nouvelle ère d'épanouissement maximal de l'humanité, selon Demis Hassabis

Meta va décupler sa puissance de calcul dans le cadre de la formation de Llama 4 et pourrait le lancer l'année prochaine, mais l'impact climatique de cette infrastructure potentiellement énergivore inquiète
Vous avez lu gratuitement 318 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de totozor
Expert confirmé https://www.developpez.com
Le 25/09/2024 à 7:35
Citation Envoyé par Jade Emy Voir le message
Pensez-vous que ces déclarations sont crédibles ou pertinentes ?
Bien sur, nous savons tous que le climat c'est comme une voiture, quand il est cassé on le répare, avec des tournevis et du WD40.
Bien sur, nous savons tous, surtout depuis la physique quantique, que la physique est un domaine fini que nous mettons du temps à découvrir parce que nous sommes médiocres.
Quel est votre avis sur le sujet ?
Sam Altman est un clown qui ne sait pas de quoi il parle.
Mais il le dit surement mieux que moi parce qu'il lève des millions d'euros avec ce genre d'intervention.
Sam Altman prévoit que l'IA sera une ressource qui fera l'objet de guerres et deviendra principalement un outil pour les riches.[...]
Bref la même chose qu'aujourd'hui mais en pire
[...]Mais Sam Altman affirme que des triomphes stupéfiants, comme réparer le climat, établir une colonie spatiale et découvrir toute la physique, finiront par devenir monnaie courante avec l'AGI
Ah beh tout va bien alors...
Ceci dit non seulement on va réparer le climat et découvrir la physique mais en plus se sera monnaie courante...
11  0 
Avatar de popo
Expert confirmé https://www.developpez.com
Le 25/09/2024 à 11:13
Mais Sam Altman affirme que des triomphes stupéfiants, comme réparer le climat, établir une colonie spatiale et découvrir toute la physique, finiront par devenir monnaie courante avec l'AGI
MDR, l'IA, dont l'entraînement et l'utilisation des modèles génèrent d'importantes émissions de CO2 et dont les centres de données nécessaires à son fonctionnement consomment d'importantes quantités d'eau pour le refroidissement, serait bon pour le climat !!!
9  0 
Avatar de Jon Shannow
Membre extrêmement actif https://www.developpez.com
Le 24/09/2024 à 16:45
Il fume la même chose que Musk, celui-là ?
7  0 
Avatar de
https://www.developpez.com
Le 25/09/2024 à 8:54
Sam Altman, PDG d'OpenAI, prévoit une superintelligence dans "quelques milliers de jours", qui permettra de réparer le climat, d'établir une colonie spatiale et de découvrir toute la physique
Fuite en avant, solutionnisme technologique, annonces itératives (Coué ?)
Le problème actuellement est dans l'orientation "business as usual" d'LLM par exemple : c'est comme de faire d'un-e hyperingénieur-e généraliste ... un distributeur de prospectus. Question d'usage et de mode de vie : faire croire que de frotter un smartphone va faire apparaître un génie alors qu'i s'agit de géolocaliser, orienter le désir, toussa ...
Hors la question n'est pas de savoir à qui ça profite : la question est de découvrir si un génie va apparaître. Et à l'intérieur de cette question, il y a : quel(s) vœu(x) allons-nous faire ?
Et ça ... c'est une question d'esprit.
4  0 
Avatar de DrHelmut
Membre actif https://www.developpez.com
Le 30/09/2024 à 7:57
Le terme "IA" dans la gen AI est un pur terme marketing (et ça marche) alors qu'on a en vérité un produit qui est un simple exécutant qui ne prend aucune décision.
Pour moi, la révolution est dans la capacité d'analyse sémantique, et il est vrai que ça permet des usages très cool, avec un gain de temps certain.

Mais il faut un prompt. L'outil fait (plutôt très bien) ce qu'on lui demande. Il n'y a pas d'intelligence, de capacité d'initiative, d'autonomie dans ce qu'on nous vend comme étant de l''IA aujourd'hui.
4  0 
Avatar de Jipété
Expert éminent sénior https://www.developpez.com
Le 30/09/2024 à 18:44
Citation Envoyé par OuftiBoy Voir le message
Pour en revenir au prédiction d'Altman, qui profétice qu'on aura cela dans quelques milliers de jours, c'est assez flou comme délai... quelques milliers de jours, c'est au minimum dans (2 milliers de jours), soit 6 ans (quelques induisant un chiffre > 1), soit dans (10 milliers de jour), et donc dans 27 ans, bref, ça ne veut strictement rien dire, c'est parler pour parler, et surtout pour ne rien dire.
Oh, il y en a tout plein, ici et ailleurs, qui écrivent pour écrire-pour-eux parce que les autres ne peuvent pas comprendre ce qui est écrit tellement c'est bourré de tout et n'importe quoi, suivez mon regard...
Par exemple, les bouts de phrases entre parenthèses peuvent en général être enlevés, ce qui pourrait donner c'est au minimum dans, soit 6 ans, soit dans, et donc dans 27 ans, charabia incompréhensible et gaspilleur d'espace disque, comme souvent ici.

Tu as une manière bien personnelle d'écrire et donc (d'essayer) de communiquer mais àmha, avec cette méthode tu vas dans le mur...
Tu devrais la revoir.
4  0 
Avatar de calvaire
Expert éminent https://www.developpez.com
Le 12/11/2024 à 11:57
est il vraiment pertinent de faire un gros modèle ?

j'ai déja eu un cas concret dans le passé (rien a voir avec les llm), plus on faisait un gros réseau de neurone avec de la data (de "qualité" en plus) plus le modèle était mauvais/stagnait (overfitting).
au final nous avons fait plusieurs petit modèle et un classifier en front pour choisir le modèle en fonction des données d'entrées, les résultats était bien meilleurs ainsi.
l'article parle t'il d'ia généraliste comme chatgpt ou d'ia spécialisé par exemple dans le code ou des 2 ?

De toute façon cette technos et fatalement limité par la production humaine, si demain l'ia remplace les devs, alors l'ia ne pourra plus évoluer. C'est grâce à des humains qui écrive des docs, trouve des bugs les corrige ou écrive sur les forum comment les contourner et donne des réponses bénévolement sur stackoverflow que l'ia progresse.

Or l’informatique c'est surement le domaine le moins stable dans le monde, y'a toujours une nouvelle technos, une nouvelle version, des patchs de sécurité a faire...si bien que il faut évoluer et s'adapter, pour un humain, c'est un aspect que l'on peut aimer ou détester, mais ce que l'on apprends à la sortie d'école et déjà obsolète, c'est de l'apprentissage continue.

edit: même dans le cas d'ia orienté code, une fois ratissez les forums style stackoverflow, c'est compliqué d'aller plus loins

par contre, j'imagine dans le futur une fonctionnalité pour les entreprises permettant de donner à l'ia toute la base de code et doc technique de l'entreprise et s'entrainer dessus, ainsi l'ia aurait le contexte de l'entreprise et le coding standard. Ca serait déja une belle amélioration dans la qualité des réponses.
par exemple je lui demande comment me connecter une l'api d'un service interne, elle va me donner le code, comment m'y connecter (demander à Jean Jacque sur teams de me crée un compte machine avec token en lecture, ensuite de tester la connexion avec ce code et enfin la fonctionnalité que vous avez demandez)
4  0 
Avatar de vVDB.fr
Membre régulier https://www.developpez.com
Le 11/12/2024 à 17:33
Triste comme ces personnes peuvent fumer de la moquette !
Ils sont donc arrivé à faire une AI Générale !
Alors plus d'hallucinations, de mensonges, de biais ! Wahoo !!!
Cette AIG est capable d'évaluer la pertinence de ce qu'elle dit avec les sources ? De tester la robustesse des données de sa base d'intelligence ? D'en demander de supplémentaires car elle ne peut répondre a la question posée ? ...
Ah ! Non... Crottes !!!

Les IA des modèles actuels sont des perroquets scolastiques qui proposent le plus probable et normalement (malheureusement) incapables de produire une idée neuve par rapport à sa base d' apprentissage.
La connaissance encyclopédique n'est pas de l'intelligence, c'est juste bluffant.
Si cette iag fait de l'inférence, quelles sont les domaines mathématiques qu'elle aurait déjà épuisé ? Les trucs sympas qu'elle a démontré avec plus de finesse que l'humain ?
Altman sera mort avant que l'humanité le voit. Il est jeune Altman...
4  0 
Avatar de r0d
Expert éminent https://www.developpez.com
Le 30/12/2024 à 10:02
Citation Envoyé par Mat.M Voir le message
ça c'est un truc bien français la technophobie.
Et si un jour vous avez une pathologie et que votre médecin interroge un système d'I.A. pour établir un diagnostic afin de guérir rapidement ?
C'est un truc bien français de mépriser les français. Intéressante proposition récursive... J'ai l'impression que c'est dû au fait que nous nous croyons au centre du monde, un peu comme les américains: Non les français ne sont pas plus technophobes que les autres, mais il faudrait s'intéresser aux autres pour s'en rendre compte.
J'ai vécu dans plusieurs pays, et je peux t'assurer que l'immense majorité des poncifs sur les français sont faux.

Je ne suis pas technophobe, mais je suis critique.
De toutes façons, je pense qu'il y a quiproquo: Je critiquais l'utilisation des LLM, pas de l'IA en général.
4  0 
Avatar de Matthieu Vergne
Expert éminent https://www.developpez.com
Le 07/07/2025 à 22:15
Citation Envoyé par Artemus24 Voir le message
Si je prends le cas de ChatGPT, il se sert de l'internet comme base de données pour effectuée une recherche. Rien à voir avec un quelconque apprentissage. Il peut même retourner de fausses informations puisqu'il est incapable de comprendre le sens même de la question posée. C'est en cela que je dis que pour l'instant, l'IA est une fumisterie, car ce que l'on nous présente n'est pas une IA générative et n'a aucune capacité d'apprentissage, juste une recherche améliorée.
Si si, c'est de l'apprentissage, mais tu es tombé dans le piège marketing de l'IA. Ce que l'IA générative apprend, ce n'est pas le savoir que tu trouves sur internet. C'est comment écrire du contenu qui ressemble à ce que tu trouves sur internet. C'est très différent et ça éclaire beaucoup de choses.

ChatGPT, Mistral, Claude, Gemini, et des milliers d'autres LLM qu'on peut trouver sur Hugging Face, y compris des équivalents des modèles commerciaux précédents, sont bel et bien basé sur l'apprentissage. Quand tu fais une requête, le principe de base du LLM n'est pas de faire une recherche sur internet. Il ne l'utilise pas lors de ta requête. Le LLM a été entrainé auparavant sur le contenu internet, comme AlphaGo a été entrainé sur des parties existantes de Go avant de jouer ses matchs. Mais là où AlphaGo a appris à jouer au Go, les LLM apprennent à générer du texte humain : ce qui vient après "le chat a mangé la" est de toute évidence "souris", parce que c'est ça le plus probable dans un texte humain. Peu importe que ce soit vrai ou pas, c'est statistiquement le plus probable. Un LLM génère du texte cohérent, et non pas vrai, c'est fondamental à comprendre car c'est la raison pour laquelle il peut fournir de fausses informations. On appelle ça des illusions mais ça n'a rien de spécial : c'est la limite fondamentale d'un LLM. La ressemblance à du texte humain est tout ce qui compte, la vérité il ne la connais pas. Internet sert à l'entrainement, mais à l'usage il génère une réponse sur la base de ce qu'il en a retenu, sans l'utiliser à nouveau.

Maintenant les LLM peuvent être augmentés par différents outils, et pour comprendre comment ça fonctionne il faut comprendre que plus on donne de contexte et plus le LLM pourra générer une réponse orientée. Par exemple, si tu ajoute comme contexte "Dans un monde où les plus petits mangent les plus gros" ce qui vient après "le chat a mangé la" pourrais bien être autre chose que "souris", genre "vache", car ça ne serait pas cohérent avec ce qui a été écrit avant. Ainsi, apporter du contexte permet d'orienter la réponse pour que le LLM génère une réponse cohérente qui va dans le sens qui nous intéresse. Cela reste statistique, on n'aura pas forcément ce qu'on veut, mais les chances augmentent.

Une fois qu'on sait exploiter le contexte, on peut utiliser des outils du genre récupération de données sur internet. On les ajoute au contexte avant de demander de répondre. La réponse sera donc influencée par ce qu'on a ajouté au contexte. Toujours dans le but de générer du texte cohérent, et non pas vrai. Tu peux ajouter des pages Web, des PDFs, des images (pour les modèles qui savent les traiter) et autres données au format textuel (CSV, Markdown, XML, JSON, etc.). Si tu demandes "Décrit moi les caractéristiques d'un transistor BD777", il te sortira quelque chose qui ressemble à une description technique de transistor, mais si tu compares à la datasheet ça sera surement du pur bullshit. Si tu lui donnes la datasheet en contexte, la même question te retournera quelque chose de bien plus proche de la réalité, peut-être même parfaitement correct. Pas parce que c'est ce qui est vrai (il peut toujours sortir du bullshit) mais parce que c'est cohérent avec le contexte donné avec la requête.

Une fois qu'on a compris ça, on a compris qu'il ne faut jamais faire aveuglément confiance à un LLM. Il faut soit lui demander des trucs où on se fiche de l'aspect véridique (e.g. role play, création d'histoire, etc.) soit lui demander des trucs dont on sait pertinement qu'on passera derrière pour vérifier (ou un tiers de confiance, genre une suite de tests valides pour du code généré par IA). On peut être surpris de voir quelque chose qui semble fonctionner à la perfection, mais on n'est jamais à l'abri d'un dérapage complet.

Tout comme AlphaGo est très bon pour jouer au Go, les LLM sont très bon pour générer du texte cohérent. Mais comme on ne demandera pas à AlphaGo d'expliquer ses coups, on ne demandera pas au LLM de dire des choses factuellement vraies. Il n'en sont juste pas capables car pas entraînés pour ça. La phase de fine tuning qui vient après l'apprentissage oriente le type de discours du LLM, mais ça ne corrige pas complètement ses lacunes fondamentales.

À voir ce qu'il en sera avec ce que Yann Lecun nous sortira.
4  0