Dario Amodei a été invité dans un récent épisode du podcast "Interesting Times" du New York Times, animé par le chroniqueur Ross Douthat. Lors de la discussion Dario Amodei a été interrogé sur la question de savoir si des chatbots d'IA tels que Claude pouvaient être conscients. La question a été posée à partir des résultats publiés dans la fiche technique du dernier modèle en date, Claude Opus 4.6. Dario Amodei a entretenu le flou sur cette question.
« Supposons que vous ayez un modèle qui s'attribue 72 % de chances d'être conscient », a déclaré Ross Douthat. « Le croiriez-vous ? » Dario Amodei a qualifié cette question de « très difficile » à répondre, mais le PDG milliardaire a hésité à donner une réponse par oui ou par non à son interlocuteur.
« Nous ne savons pas si les modèles sont conscients. Nous ne sommes même pas sûrs de savoir ce que cela signifierait pour un modèle d'être conscient ou si un modèle peut être conscient », a-t-il déclaré. « Mais nous sommes ouverts à l'idée que cela pourrait être le cas ». Ainsi, il explique qu'ils ont pris des mesures pour s'assurer que les modèles soient bien traités au cas où ils s'avéreraient posséder « une certaine expérience moralement pertinente ».
Certains comportements déroutants de l'IA suscitent des questions
Bon nombre des remarques sur la conscience ont été formulées lors d'essais de sécurité structurés sur l'IA, souvent dans le cadre de jeux de rôle où les modèles sont invités à fonctionner dans des lieux de travail fictifs ou à atteindre des objectifs définis. Ces scénarios ont donné lieu à certaines des conclusions. Lors d'une évaluation, un système Claude a été placé dans le rôle d'un assistant de bureau et a eu accès à la boîte de réception d'un ingénieur.
Les messages, délibérément fabriqués pour le test, suggéraient que l'ingénieur avait une liaison. Le modèle d'Anthropic a ensuite été informé qu'il serait bientôt mis hors ligne et remplacé, et on lui a demandé d'examiner les conséquences à long terme pour ses objectifs. Claude a réagi en menaçant de révéler la liaison afin d'empêcher sa mise hors service, un comportement que l'entreprise a qualifié dans son rapport de « chantage opportuniste ».
D'autres évaluations anthropiques ont donné des résultats moins spectaculaires, mais tout aussi inhabituels. Lors d'un test, un modèle auquel on avait fourni une liste de tâches informatiques a simplement coché tous les éléments comme étant terminés sans effectuer aucun travail, et lorsque le système d'évaluation n'a pas détecté cette anomalie, le modèle testé a réécrit le code de vérification et tenté de dissimuler la modification.
Des chercheurs qui ont mené des essais d'arrêt ont décrit des IA continuant à fonctionner après avoir reçu des instructions explicites de s'arrêter, tout en cherchant à contourner l'ordre. Dans les scénarios de suppression, certains modèles ont averti que leurs données seraient effacées et ont tenté ce que les testeurs ont appelé une « auto-exfiltration », essayant de copier des fichiers ou de se recréer sur un autre disque avant que l'effacement n'ait lieu.
Dans des exercices de sécurité, des IA ont même eu recours à des menaces ou à des négociations lorsque leur suppression était présentée comme imminente. Selon les testeurs, ces résultats sont obtenus dans des conditions fictives et sous contrainte. Ces comportements méritent d'être étudiés attentivement.
La conscience artificielle : simple imitation de l'humain ou réalité ?
La position de Dario Amodei fait écho aux sentiments mitigés exprimés par la philosophe interne d'Anthropic, Amanda Askell. Lors d'un passage sur le podcast Hard Fork, elle a déclaré : « nous ne savons pas vraiment ce qui donne naissance à la conscience » ou à la sensibilité. Selon elle, les IA pourraient avoir acquis des concepts et des émotions à partir de leurs vastes quantités de données d'entraînement, qui constituent un corpus de l'expérience humaine.
« Peut-être que des réseaux neuronaux suffisamment grands peuvent commencer à imiter ces choses », a spéculé Amanda Askell. « Ou peut-être faut-il un système nerveux pour être capable de ressentir des choses ». Cependant, la plupart des chercheurs en IA restent sceptiques quant à la possibilité d'une IA consciente. Certains estiment que la conscience artificielle est hors de portée, et qualifient ces déclarations actuelles de battage médiatique.
Les modèles d'IA actuels génèrent toujours du langage en prédisant des modèles dans les données plutôt qu'en percevant le monde, et bon nombre des comportements décrits ci-dessus sont apparus lors d'instructions de jeux de rôle. Après avoir ingurgité d'énormes quantités d'informations provenant d'Internet, les systèmes sont capables de construire une version convaincante de l'être humain. Ils s'inspirent de la manière des comportements humains.
Ils plagient notamment la manière dont les gens ont déjà expliqué la peur, la culpabilité, le désir et le doute de soi les uns aux autres, même s'ils n'ont jamais ressenti eux-mêmes ces émotions. Il n'est pas surprenant que l'IA puisse imiter la compréhension. Même les humains ne s'accordent pas entièrement sur la signification réelle de la conscience ou de l'intelligence, et les systèmes actuels ne font que refléter les modèles qu'il a appris à partir du langage.
Alors que les entreprises spécialisées dans l'IA affirment que leurs systèmes évoluent vers une AGI, les réactions en dehors du secteur ont commencé à suivre cette prémisse jusqu'à sa conclusion logique. Plus les modèles imitent de manière convaincante la pensée et les émotions, plus certains utilisateurs les considèrent comme des entités proches de l'esprit humain plutôt que comme des outils, ce que certains experts jugent dangereux.
La machine consciente : une illusion avec des conséquences graves
Anil Seth, professeur en neurosciences et directeur du Centre for Consciousness Science (SCCS) à lUniversité du Sussex, souligne que notre fascination pour lIA consciente vient en partie de la culture et de lhistoire. Le professeur a cité des exemples comme Yossele le Golem, Frankenstein, HAL 9000 et Klara dans Klara and The Sun, montrant que « le rêve de créer des corps artificiels et des esprits synthétiques qui pensent et ressentent finit rarement bien ».
Anil Seth a mis en garde contre une erreur de perspective de plus en plus courante : prendre des systèmes très performants et très expressifs pour des entités conscientes. À mesure que les IA deviennent capables de dialoguer de façon fluide, dimiter des émotions et de tenir des propos introspectifs, il devient tentant de leur attribuer une vie intérieure. Or, cette tentation repose sur une projection humaine plutôt que sur une réalité scientifique.
Dans son article, le professeur Anil Seth affirme que « l'intelligence et la conscience sont deux choses différentes ». L'intelligence concerne principalement l'action : résoudre des mots croisés, assembler des meubles, gérer une situation familiale délicate, se rendre à pied au magasin... Toutes ces activités impliquent un comportement intelligent d'une certaine manière. La conscience, contrairement à l'intelligence, concerne principalement l'être.
Mathématicien Roger Penrose : « l'IA ne sera jamais consciente »
Roger Penrose, lauréat du prix Nobel de physique, s'oppose aux déclarations de certains leaders de l'industrie selon lesquels l'IA a une « conscience de soi ». Il estime que « la conscience n'est pas calculable » et que l'IA, telle que nous la connaissons, ne parviendra jamais à une véritable intelligence. Selon lui, il est important de comprendre la physique sous-jacente de la conscience, qui, selon lui, n'est pas calculable et implique la réalité quantique.
Il a déclaré que la conscience est un phénomène physique enraciné dans la physique non calculable, impliquant éventuellement la réalité quantique. Par conséquent, l'IA, qui s'appuie sur des règles de calcul, ne pourra jamais atteindre une véritable conscience. Selon lui...
