Donner une personnalité aux modèles de langage, c'est simplement du bon travail d'ingénierie, par Sean GoedeckeLes sceptiques de l'IA soutiennent souvent que les systèmes d'IA actuels ne devraient pas ressembler autant à des humains. L'idée – récemment exprimée dans cet article d'opinion de Nathan Beacom – est que les modèles de langage devraient être explicitement des outils, à l'instar des calculatrices ou des moteurs de recherche. Bien qu'ils puissent se faire passer pour des personnes, ils ne devraient pas le faire, car cela encourage les utilisateurs à surestimer les capacités de l'IA et (au pire) à sombrer dans une psychose liée à l'IA. Voici un paragraphe représentatif de cet article :
En résumé, une grande partie de la confusion autour de la moralité de l'IA provient d'une réflexion floue sur les outils à notre disposition. Il y a quelque chose qu'Anthropic pourrait faire pour rendre son IA morale, quelque chose de bien plus simple, élégant et facile que ce que fait Askell. Cessez de lui donner un nom humain, cessez de l’habiller comme une personne, et ne lui donnez pas la capacité de simuler des relations personnelles, des choix, des pensées, des croyances, des opinions et des sentiments que seules les personnes possèdent réellement. Présentez-la et utilisez-la uniquement pour ce qu’elle est : un outil statistique extrêmement impressionnant, mais imparfait. Si nous utilisions tous cet outil en conséquence, une grande partie de ce problème moral serait résolue.
Les modèles d'IA modernes — qu'ils soient conçus pour le chat, comme le GPT-5.2 d'OpenAI, ou pour des tâches agentiques de longue durée, comme Claude Opus 4.6 — ne surgissent pas naturellement de leurs océans de données d'entraînement. Au contraire, lorsque vous entraînez un modèle sur des données brutes, vous obtenez un « modèle de base », qui n'est pas très utile en soi. Vous ne pouvez pas lui demander d'écrire un e-mail à votre place, de relire votre dissertation ou de réviser votre code.
Le modèle de base est une sorte de gestalt mystérieuse de ses données d'entraînement. Si vous lui fournissez du texte, il continuera parfois dans cette veine, ou d'autres fois, il commencera à produire du charabia pur et simple. Il n'a aucun mal à produire du code présentant d'énormes failles de sécurité, ou de l'anglais horriblement écrit, ou des diatribes racistes — toutes ces choses sont représentées dans ses données d'entraînement, après tout, et le modèle de base ne juge pas. Il se contente de produire.
Pour construire un modèle d’IA utile, vous devez vous aventurer dans le modèle de base sauvage et délimiter une zone qui soit compatible avec les intérêts humains : à la fois sur le plan éthique, dans le sens où le modèle n’abusera pas de ses utilisateurs, et sur le plan pratique, dans le sens où il produira plus souvent des résultats corrects que des résultats incorrects. Concrètement, cela signifie que vous devez donner une personnalité au modèle lors de la post-formation1.
Les êtres humains sont capables de presque n'importe quelle action à tout moment. Mais nous n'en choisissons qu'un infime sous-ensemble, car c'est le genre de personnes que nous sommes. Je pourrais jeter ma tasse de café sur le mur à l'instant même, mais je ne le fais pas, car je ne suis pas le genre de personne à mettre inutilement du désordre2. Il en va de même pour les systèmes d'IA. Claude pourrait répondre à ma question par des insultes racistes incohérentes — le modèle de base en est tout à fait capable — mais il ne le fait pas, car ce n’est pas le genre de « personne » qu’il est.
En d’autres termes, les personnalités de type humain ne sont pas imposées aux outils d’IA comme une sorte de stratagème marketing ou d’erreur philosophique. Ces personnalités sont le moyen par lequel le modèle linguistique peut devenir utile. C’est pourquoi il est étonnamment délicat de « simplement » changer la personnalité ou les opinions d’un modèle linguistique : parce que vous naviguez dans la variété quasi infinie du modèle de base. Vous pouvez peut-être contrôler la direction que vous prenez, mais vous ne pouvez pas contrôler ce que vous y trouvez3.
Lorsque les spécialistes de l’IA parlent des LLM comme ayant des personnalités, des désirs, voire une âme4, il s’agit de termes techniques, à l’instar de la « mémoire » d’un ordinateur ou de la « transmission » d’une voiture. Il est tout simplement impossible de construire un système d’IA performant qui « se contente d’agir comme un outil », car le modèle est entraîné sur des textes écrits par des humains à propos d’autres humains. Il faut lui insuffler une certaine personnalité (idéalement celle d’un assistant utile et amical) afin qu’il puisse puiser dans les aspects utiles de ses données d’entraînement plutôt que dans les aspects horribles.
Source : Giving LLMs a personality is just good engineering
Et vous ?
Pensez-vous que cette déclaration est crédible ou pertinente ?
Quel est votre avis sur le sur sujet ?Voir aussi :
Mon guide d'ingénierie des prompts ou instructions génératives d'IA pour les développeurs, par Namanyay Goel
Tout le monde parle de vibe coding : guide pour générer rapidement une application avec les modèles d'instructions génératives exacts par Jay Gordon
Comment j'utilise les LLM en tant qu'ingénieur logiciel, par sean goedecke
Vous avez lu gratuitement 263 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.