IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

« L'AGI n'arrivera pas avant plusieurs décennies, voire plus », affirme le chercheur en IA Andrew Ng,
Qui ajoute que les prédictions sur une arrivée imminente s'appuient sur des définitions biaisées de l'AGI

Le , par Mathis Lucas

21PARTAGES

9  0 
« L'AGI n'arrivera pas avant plusieurs décennies, voire plus », affirme le chercheur en IA Andrew Ng
qui ajoute que les prédictions sur une arrivée imminente s'appuient sur des définitions biaisées de l'AGI

Andrew Ng, chercheur en IA, dénonce le battage médiatique autour de l'intelligence artificielle générale (AGI). Il réfute les prédictions audacieuses sur l'arrivée imminente de l'AGI et déclare que les entreprises à l'origine de ces prédictions utilisent des définitions erronées ou biaisées de la technologie. Le chercheur en IA a déclaré que ces définitions douteuses permettent à ces acteurs de la course à l'AGI d'abaisser la barre. Selon lui, si l'on prend en compte la définition standard de l'AGI, l'industrie est encore à des décennies de cette technologie, voire plus, et cette dernière ne sera pas là dans un an ni deux ans.

Un pionnier de l'IA affirme que l'industrie est encore à des décennies de l'AGI

Les investisseurs et les entreprises spécialisées dans l'IA injectent actuellement des centaines de milliards de dollars dans la course à l'IA, et une grande partie de cette somme est consacrée au développement d'une technologie encore théorique : l'intelligence artificielle générale. OpenAI, le fabricant du chatbot d'IA ChatGPT, a fait de la création de l'AGI une priorité absolue. Ses rivaux tels que Google, Meta et Microsoft consacrent également leurs meilleurs chercheurs au même objectif. Mais le développement de l'AGI fait face à de nombreux défis et l'un des principaux défis concerne la définition même de la technologie.



En effet, la définition de l'AGI n'est pas la même pour tout le monde. Cet état de choses crée une certaine confusion quant à la distance qui sépare l'industrie de l'invention de cette technologie qui est censée changer le monde. Cela donne lieu à des prédictions audacieuses de la part de certains acteurs de la course à l'IA. À titre d'exemple, Elon Musk, PDG du constructeur automobile Tesla, s'attend à ce que l'IA surpasse l'intelligence humaine d'ici la fin de l'année 2025.

Mais le chercheur en IA Andrew Ng affirme que ces prédictions relèvent plus du battage médiatique que de la réalité. Andrew Ng, 48 ans, est chercheur américain en IA et professeur associé au département de science informatique de l'université Stanford. Son travail concerne principalement l'apprentissage automatique et la robotique. Lors d'une récente interview avec Techsauce, Andrew Ng a déclaré que ces prédictions reposent sur des définitions biaisées de l'AGI.

Citation Envoyé par Andrew Ng


En ce qui concerne l'AGI, la définition standard est qu'il s'agit d'une IA capable d'accomplir toutes les tâches intellectuelles que l'homme peut accomplir. Par conséquent, lorsque nous aurons l'AGI, l'IA devrait être capable d'apprendre à conduire une voiture, à piloter un avion ou à rédiger une thèse de doctorat à l'université.

Pour cette définition de l'AGI, je pense que nous en sommes encore à plusieurs décennies, voire plus. J'espère que nous y parviendrons de notre vivant, mais je n'en suis pas sûr.

L'une des raisons pour lesquelles l'AGI a fait l'objet d'un battage médiatique selon lequel elle sera là dans quelques années seulement est que certaines entreprises utilisent des définitions très inhabituelles de l'AGI et si l'on redéfinit l'AGI de façon à abaisser la barre, alors bien sûr nous pourrions y arriver en 1 ou 2 ans.

Mais si l'on s'en tient à la définition standard de l'AGI, à savoir une IA capable d'accomplir n'importe quelle tâche intellectuelle que l'homme peut accomplir, je pense que nous en avons encore pour plusieurs décennies, mais je pense que ce serait formidable si nous y parvenions.

L'échelle de temps utilisée par Andrew Ng est vague et ouvre la voie à de nombreuses spéculations. Son idée pourrait vouloir dire qu'il y a un énorme fossé entre les grands modèles de langage (LLM) actuels et l'intelligence humaine. Et que l'industrie n'a aucune idée de la manière de combler ce fossé. En outre, bien que Andrew Ng parle de définition standard de l'AGI, il est important de souligner que jusqu'à présent, il n'existe aucun consensus dans l'industrie sur le sujet.

L'un des critiques de son avis a écrit : « Andrew Ng dit qu'ils ont placé la barre bas pour l'AGI, mais personne n'a la définition exacte du terme en premier lieu. Je peux dire qu'il place la barre haut, et nous tournerons en rond. Ensuite, des effets cumulatifs équivalents peuvent affecter la société dès les prochaines générations d'IA. Et cela est plus important que le débat capricieux sur le moment où le monde se mettra d'accord sur ce qu'il faut appeler vraiment AGI ».

Certains acteurs ont adopté une échelle pour suivre leur évolution vers l'AGI

L'une des définitions courantes de l'AGI est celle qui décrit la technologie comme une IA avancée capable de raisonner comme les humains. Mais pour certains, c'est plus que cela. Ian Hogarth, coauteur du rapport annuel "State of AI", définit l'AGI comme une « IA semblable à Dieu ». Tom Everitt, chercheur sur la sécurité de l'AGI chez Google DeepMind, la décrit comme un système d'IA capable de résoudre des tâches d'une manière qui ne se limite pas à la façon dont ils ont été formés. Sam Altman, PDG d'OpenAI, a déclaré que ChatGPT aurait pu être considéré comme une AGI s'il était sorti 10 ans plus tôt.

« Aujourd'hui, les gens se disent qu'il s'agit d'un gentil petit chatbot ou autre », a déclaré Altman. Il estime que ce comportement peut être expliqué par deux choses : l'effet IA et l'absence de consensus sur la définition de l'intelligence. L'expression "effet IA" décrit un phénomène selon lequel une fois qu'une tâche ou une capacité est automatisée ou accomplie avec succès à l'aide de l'IA, elle n'est plus considérée comme faisant partie de la "véritable" IA.

Autrement dit, dès qu'un système d'IA devient compétent pour une tâche donnée, les gens ont tendance à ne plus le considérer comme une IA et à le percevoir comme une simple opération de routine ou régulière. Ainsi, l'on pense que chaque succès de l'IA la redéfinit. « Nous ne pourrons jamais dire ce qu'est réellement l'AGI si nous continuons à repousser les limites. La technologie peut toujours être améliorée », a écrit un critique en soutien aux propos d'Altman.

Pour faire face à ce défi, OpenAI a élaboré une échelle de classification à 5 niveaux afin de suivre l'évolution de ses technologies d'IA vers l'AGI. Les niveaux vont des capacités actuelles de l'IA conversationnelle (niveau 1) à une IA capable d'effectuer des tâches organisationnelles (niveau 5). Le système de classification a été présenté aux employés lors d'une réunion à l'échelle de l'entreprise et sera aussi partagé avec les investisseurs et les parties externes.

Les dirigeants d'OpenAI ont informé le personnel que l'entreprise est convaincue d'en être au stade initial. En outre, la direction a ajouté que l'entreprise est très proche d'un système de niveau 2, composé des machines intelligentes appelées "raisonneurs". Altman a précédemment déclaré qu'il pense que l'AGI pourrait être atteinte au cours de cette décennie. Ce qui signifie qu'OpenAI s'attend à atteindre le niveau 5 de son échelle avant la fin de cette décennie.

OpenAI n'est pas le seul acteur de la course à l'IA à tenter de contourner le problème avec une échelle de classification. Dans un article publié en novembre 2023, des chercheurs de Google DeepMind ont proposé un cadre de cinq niveaux ascendants d'IA, comprenant des niveaux comme "expert" et "surhumain". Cette échelle ressemble à un système auquel l'industrie automobile fait souvent référence pour évaluer le degré d'automatisation des voitures autonomes.

Quelques prédictions de chercheurs en IA et de dirigeants sur l'avenir de l'IA

Demis Hassabis, PDG de Google DeepMind, a déclaré l'année dernière que l'industrie pourrait atteindre une forme d’IA de niveau humain dans une décennie, ce qui donnerait aux machines un sens commun. Selon lui, cette IA serait un système capable de raisonnement causal. En mars, le PDG de Nvidia, Jensen Huang, a déclaré que l'industrie pourrait atteindre une forme d'AGI d'ici à cinq ans. Selon une enquête publiée par "Our World in Data", les prévisionnistes estiment qu'il y a une chance sur deux pour qu'une AGI soit conçue, testée et annoncée publiquement d'ici 2040, c'est-à-dire dans moins de 20 ans.

Translated, une société de traduction, a mis au point un indicateur, le Time to Edit (TTE), pour calculer le temps nécessaire aux rédacteurs humains professionnels pour corriger les traductions générées par l'IA par rapport aux traductions humaines. Cela pourrait aider à quantifier la vitesse à laquelle nous nous rapprochons de la singularité. Translated a calculé qu'il faut environ une seconde à un traducteur humain pour corriger chaque mot produit par un autre traducteur humain. En 2015, les rédacteurs professionnels mettaient environ 3,5 secondes par mot pour réviser une suggestion traduite par une machine.

À l'heure actuelle, ce délai a été ramené à 2 secondes. Si cette tendance se poursuit, Translated prévoit que sa technologie d'IA atteindra la qualité de la traduction humaine d'ici la fin de la décennie, voire plus tôt. D'autres enquêtes menées auprès d'experts en IA aboutissent à des conclusions similaires. La pertinence de l'indicateur élaboré par Translated est toutefois remise en cause par de nombreux critiques dans la communauté de l'IA.

Yann LeCun, lauréat du prestigieux prix Turing et responsable de l'IA chez Meta, ne partage pas la prédiction audacieuse de Musk selon laquelle l'IA surpassera l'intelligence humaine dès l'année prochaine. Le chercheur en IA affirme qu'une AGI est inéluctable, mais qu'elle n'arrivera pas d'ici à un an. Il a également déclaré que l'AGI n'émanera pas des grands modèles de langage (LLM) actuels, bien qu'ils puissent en constituer une composante.

Pour LeCun, ces modèles d'IA ne sont pas en mesure de résoudre les défis cognitifs tels que le raisonnement, la planification, la mémoire persistante et la compréhension du monde physique. « Il s'agit de quatre caractéristiques essentielles de l'intelligence humaine - et de l'intelligence animale, d'ailleurs - que les systèmes d'IA actuels ne peuvent pas réaliser », explique-t-il. Il affirme notamment que les modèles d'AI actuels ne sont pas plus intelligents qu'un chien.

Les enquêtes auprès des experts sont un élément d'information à prendre en compte lorsque nous réfléchissons à l'avenir de l'IA. Toutefois, il est important de ne pas surestimer les résultats de ces enquêtes. Selon certains rapports, les experts d'une technologie particulière ne sont pas nécessairement ceux qui sont à même de prédire l'avenir de cette technologie. Ce qui peut parfois donner lieu à un battage médiatique intense autour de cette technologie.

Source : Andrew Ng

Et vous ?

Quel est votre avis sur le sujet ?
Que pensez-vous des propos d'Andrew Ng selon lesquels les prédictions sur l'AGI sont basées sur une définition douteuse de la technologie ?
Quelles sont vos prédictions sur l'avenir de l'IA ? L'AGI est-elle une technologie à la portée de l'industrie ? Pourquoi ?
Selon vous, pourquoi l'industrie ne parvient pas à trouver un consensus sur la notion d'intelligence artificielle générale ?

Voir aussi

« L'atteinte d'une forme d'intelligence artificielle de niveau humain (AGI) est possible dans une décennie », d'après le PDG de Google Deepmind pour le développement responsable des systèmes d'IA

Yann LeCun affirme que l'AGI est inévitable, mais qu'elle n'arrivera pas l'année prochaine et qu'elle ne sera pas uniquement l'œuvre des LLM, il propose une piste pour créer une IA de niveau humain

Des PDG parient jusqu'à 10 millions de dollars contre la récente prédiction d'Elon Musk sur l'IA, Elon Musk prédit que l'IA surpassera l'intelligence humaine d'ici la fin de l'année 2025
Vous avez lu gratuitement 25 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de totozor
Expert confirmé https://www.developpez.com
Le 25/09/2024 à 7:35
Citation Envoyé par Jade Emy Voir le message
Pensez-vous que ces déclarations sont crédibles ou pertinentes ?
Bien sur, nous savons tous que le climat c'est comme une voiture, quand il est cassé on le répare, avec des tournevis et du WD40.
Bien sur, nous savons tous, surtout depuis la physique quantique, que la physique est un domaine fini que nous mettons du temps à découvrir parce que nous sommes médiocres.
Quel est votre avis sur le sujet ?
Sam Altman est un clown qui ne sait pas de quoi il parle.
Mais il le dit surement mieux que moi parce qu'il lève des millions d'euros avec ce genre d'intervention.
Sam Altman prévoit que l'IA sera une ressource qui fera l'objet de guerres et deviendra principalement un outil pour les riches.[...]
Bref la même chose qu'aujourd'hui mais en pire
[...]Mais Sam Altman affirme que des triomphes stupéfiants, comme réparer le climat, établir une colonie spatiale et découvrir toute la physique, finiront par devenir monnaie courante avec l'AGI
Ah beh tout va bien alors...
Ceci dit non seulement on va réparer le climat et découvrir la physique mais en plus se sera monnaie courante...
11  0 
Avatar de popo
Expert confirmé https://www.developpez.com
Le 25/09/2024 à 11:13
Mais Sam Altman affirme que des triomphes stupéfiants, comme réparer le climat, établir une colonie spatiale et découvrir toute la physique, finiront par devenir monnaie courante avec l'AGI
MDR, l'IA, dont l'entraînement et l'utilisation des modèles génèrent d'importantes émissions de CO2 et dont les centres de données nécessaires à son fonctionnement consomment d'importantes quantités d'eau pour le refroidissement, serait bon pour le climat !!!
9  0 
Avatar de Jon Shannow
Membre extrêmement actif https://www.developpez.com
Le 24/09/2024 à 16:45
Il fume la même chose que Musk, celui-là ?
7  0 
Avatar de
https://www.developpez.com
Le 25/09/2024 à 8:54
Sam Altman, PDG d'OpenAI, prévoit une superintelligence dans "quelques milliers de jours", qui permettra de réparer le climat, d'établir une colonie spatiale et de découvrir toute la physique
Fuite en avant, solutionnisme technologique, annonces itératives (Coué ?)
Le problème actuellement est dans l'orientation "business as usual" d'LLM par exemple : c'est comme de faire d'un-e hyperingénieur-e généraliste ... un distributeur de prospectus. Question d'usage et de mode de vie : faire croire que de frotter un smartphone va faire apparaître un génie alors qu'i s'agit de géolocaliser, orienter le désir, toussa ...
Hors la question n'est pas de savoir à qui ça profite : la question est de découvrir si un génie va apparaître. Et à l'intérieur de cette question, il y a : quel(s) vœu(x) allons-nous faire ?
Et ça ... c'est une question d'esprit.
4  0 
Avatar de DrHelmut
Membre actif https://www.developpez.com
Le 30/09/2024 à 7:57
Le terme "IA" dans la gen AI est un pur terme marketing (et ça marche) alors qu'on a en vérité un produit qui est un simple exécutant qui ne prend aucune décision.
Pour moi, la révolution est dans la capacité d'analyse sémantique, et il est vrai que ça permet des usages très cool, avec un gain de temps certain.

Mais il faut un prompt. L'outil fait (plutôt très bien) ce qu'on lui demande. Il n'y a pas d'intelligence, de capacité d'initiative, d'autonomie dans ce qu'on nous vend comme étant de l''IA aujourd'hui.
4  0 
Avatar de Jipété
Expert éminent sénior https://www.developpez.com
Le 30/09/2024 à 18:44
Citation Envoyé par OuftiBoy Voir le message
Pour en revenir au prédiction d'Altman, qui profétice qu'on aura cela dans quelques milliers de jours, c'est assez flou comme délai... quelques milliers de jours, c'est au minimum dans (2 milliers de jours), soit 6 ans (quelques induisant un chiffre > 1), soit dans (10 milliers de jour), et donc dans 27 ans, bref, ça ne veut strictement rien dire, c'est parler pour parler, et surtout pour ne rien dire.
Oh, il y en a tout plein, ici et ailleurs, qui écrivent pour écrire-pour-eux parce que les autres ne peuvent pas comprendre ce qui est écrit tellement c'est bourré de tout et n'importe quoi, suivez mon regard...
Par exemple, les bouts de phrases entre parenthèses peuvent en général être enlevés, ce qui pourrait donner c'est au minimum dans, soit 6 ans, soit dans, et donc dans 27 ans, charabia incompréhensible et gaspilleur d'espace disque, comme souvent ici.

Tu as une manière bien personnelle d'écrire et donc (d'essayer) de communiquer mais àmha, avec cette méthode tu vas dans le mur...
Tu devrais la revoir.
4  0 
Avatar de calvaire
Expert éminent https://www.developpez.com
Le 12/11/2024 à 11:57
est il vraiment pertinent de faire un gros modèle ?

j'ai déja eu un cas concret dans le passé (rien a voir avec les llm), plus on faisait un gros réseau de neurone avec de la data (de "qualité" en plus) plus le modèle était mauvais/stagnait (overfitting).
au final nous avons fait plusieurs petit modèle et un classifier en front pour choisir le modèle en fonction des données d'entrées, les résultats était bien meilleurs ainsi.
l'article parle t'il d'ia généraliste comme chatgpt ou d'ia spécialisé par exemple dans le code ou des 2 ?

De toute façon cette technos et fatalement limité par la production humaine, si demain l'ia remplace les devs, alors l'ia ne pourra plus évoluer. C'est grâce à des humains qui écrive des docs, trouve des bugs les corrige ou écrive sur les forum comment les contourner et donne des réponses bénévolement sur stackoverflow que l'ia progresse.

Or l’informatique c'est surement le domaine le moins stable dans le monde, y'a toujours une nouvelle technos, une nouvelle version, des patchs de sécurité a faire...si bien que il faut évoluer et s'adapter, pour un humain, c'est un aspect que l'on peut aimer ou détester, mais ce que l'on apprends à la sortie d'école et déjà obsolète, c'est de l'apprentissage continue.

edit: même dans le cas d'ia orienté code, une fois ratissez les forums style stackoverflow, c'est compliqué d'aller plus loins

par contre, j'imagine dans le futur une fonctionnalité pour les entreprises permettant de donner à l'ia toute la base de code et doc technique de l'entreprise et s'entrainer dessus, ainsi l'ia aurait le contexte de l'entreprise et le coding standard. Ca serait déja une belle amélioration dans la qualité des réponses.
par exemple je lui demande comment me connecter une l'api d'un service interne, elle va me donner le code, comment m'y connecter (demander à Jean Jacque sur teams de me crée un compte machine avec token en lecture, ensuite de tester la connexion avec ce code et enfin la fonctionnalité que vous avez demandez)
4  0 
Avatar de vVDB.fr
Membre régulier https://www.developpez.com
Le 11/12/2024 à 17:33
Triste comme ces personnes peuvent fumer de la moquette !
Ils sont donc arrivé à faire une AI Générale !
Alors plus d'hallucinations, de mensonges, de biais ! Wahoo !!!
Cette AIG est capable d'évaluer la pertinence de ce qu'elle dit avec les sources ? De tester la robustesse des données de sa base d'intelligence ? D'en demander de supplémentaires car elle ne peut répondre a la question posée ? ...
Ah ! Non... Crottes !!!

Les IA des modèles actuels sont des perroquets scolastiques qui proposent le plus probable et normalement (malheureusement) incapables de produire une idée neuve par rapport à sa base d' apprentissage.
La connaissance encyclopédique n'est pas de l'intelligence, c'est juste bluffant.
Si cette iag fait de l'inférence, quelles sont les domaines mathématiques qu'elle aurait déjà épuisé ? Les trucs sympas qu'elle a démontré avec plus de finesse que l'humain ?
Altman sera mort avant que l'humanité le voit. Il est jeune Altman...
4  0 
Avatar de r0d
Expert éminent https://www.developpez.com
Le 30/12/2024 à 10:02
Citation Envoyé par Mat.M Voir le message
ça c'est un truc bien français la technophobie.
Et si un jour vous avez une pathologie et que votre médecin interroge un système d'I.A. pour établir un diagnostic afin de guérir rapidement ?
C'est un truc bien français de mépriser les français. Intéressante proposition récursive... J'ai l'impression que c'est dû au fait que nous nous croyons au centre du monde, un peu comme les américains: Non les français ne sont pas plus technophobes que les autres, mais il faudrait s'intéresser aux autres pour s'en rendre compte.
J'ai vécu dans plusieurs pays, et je peux t'assurer que l'immense majorité des poncifs sur les français sont faux.

Je ne suis pas technophobe, mais je suis critique.
De toutes façons, je pense qu'il y a quiproquo: Je critiquais l'utilisation des LLM, pas de l'IA en général.
4  0 
Avatar de Matthieu Vergne
Expert éminent https://www.developpez.com
Le 07/07/2025 à 22:15
Citation Envoyé par Artemus24 Voir le message
Si je prends le cas de ChatGPT, il se sert de l'internet comme base de données pour effectuée une recherche. Rien à voir avec un quelconque apprentissage. Il peut même retourner de fausses informations puisqu'il est incapable de comprendre le sens même de la question posée. C'est en cela que je dis que pour l'instant, l'IA est une fumisterie, car ce que l'on nous présente n'est pas une IA générative et n'a aucune capacité d'apprentissage, juste une recherche améliorée.
Si si, c'est de l'apprentissage, mais tu es tombé dans le piège marketing de l'IA. Ce que l'IA générative apprend, ce n'est pas le savoir que tu trouves sur internet. C'est comment écrire du contenu qui ressemble à ce que tu trouves sur internet. C'est très différent et ça éclaire beaucoup de choses.

ChatGPT, Mistral, Claude, Gemini, et des milliers d'autres LLM qu'on peut trouver sur Hugging Face, y compris des équivalents des modèles commerciaux précédents, sont bel et bien basé sur l'apprentissage. Quand tu fais une requête, le principe de base du LLM n'est pas de faire une recherche sur internet. Il ne l'utilise pas lors de ta requête. Le LLM a été entrainé auparavant sur le contenu internet, comme AlphaGo a été entrainé sur des parties existantes de Go avant de jouer ses matchs. Mais là où AlphaGo a appris à jouer au Go, les LLM apprennent à générer du texte humain : ce qui vient après "le chat a mangé la" est de toute évidence "souris", parce que c'est ça le plus probable dans un texte humain. Peu importe que ce soit vrai ou pas, c'est statistiquement le plus probable. Un LLM génère du texte cohérent, et non pas vrai, c'est fondamental à comprendre car c'est la raison pour laquelle il peut fournir de fausses informations. On appelle ça des illusions mais ça n'a rien de spécial : c'est la limite fondamentale d'un LLM. La ressemblance à du texte humain est tout ce qui compte, la vérité il ne la connais pas. Internet sert à l'entrainement, mais à l'usage il génère une réponse sur la base de ce qu'il en a retenu, sans l'utiliser à nouveau.

Maintenant les LLM peuvent être augmentés par différents outils, et pour comprendre comment ça fonctionne il faut comprendre que plus on donne de contexte et plus le LLM pourra générer une réponse orientée. Par exemple, si tu ajoute comme contexte "Dans un monde où les plus petits mangent les plus gros" ce qui vient après "le chat a mangé la" pourrais bien être autre chose que "souris", genre "vache", car ça ne serait pas cohérent avec ce qui a été écrit avant. Ainsi, apporter du contexte permet d'orienter la réponse pour que le LLM génère une réponse cohérente qui va dans le sens qui nous intéresse. Cela reste statistique, on n'aura pas forcément ce qu'on veut, mais les chances augmentent.

Une fois qu'on sait exploiter le contexte, on peut utiliser des outils du genre récupération de données sur internet. On les ajoute au contexte avant de demander de répondre. La réponse sera donc influencée par ce qu'on a ajouté au contexte. Toujours dans le but de générer du texte cohérent, et non pas vrai. Tu peux ajouter des pages Web, des PDFs, des images (pour les modèles qui savent les traiter) et autres données au format textuel (CSV, Markdown, XML, JSON, etc.). Si tu demandes "Décrit moi les caractéristiques d'un transistor BD777", il te sortira quelque chose qui ressemble à une description technique de transistor, mais si tu compares à la datasheet ça sera surement du pur bullshit. Si tu lui donnes la datasheet en contexte, la même question te retournera quelque chose de bien plus proche de la réalité, peut-être même parfaitement correct. Pas parce que c'est ce qui est vrai (il peut toujours sortir du bullshit) mais parce que c'est cohérent avec le contexte donné avec la requête.

Une fois qu'on a compris ça, on a compris qu'il ne faut jamais faire aveuglément confiance à un LLM. Il faut soit lui demander des trucs où on se fiche de l'aspect véridique (e.g. role play, création d'histoire, etc.) soit lui demander des trucs dont on sait pertinement qu'on passera derrière pour vérifier (ou un tiers de confiance, genre une suite de tests valides pour du code généré par IA). On peut être surpris de voir quelque chose qui semble fonctionner à la perfection, mais on n'est jamais à l'abri d'un dérapage complet.

Tout comme AlphaGo est très bon pour jouer au Go, les LLM sont très bon pour générer du texte cohérent. Mais comme on ne demandera pas à AlphaGo d'expliquer ses coups, on ne demandera pas au LLM de dire des choses factuellement vraies. Il n'en sont juste pas capables car pas entraînés pour ça. La phase de fine tuning qui vient après l'apprentissage oriente le type de discours du LLM, mais ça ne corrige pas complètement ses lacunes fondamentales.

À voir ce qu'il en sera avec ce que Yann Lecun nous sortira.
4  0