Depuis la sortie de ChatGPT, plusieurs cas d'utilisations controversées ont été signalé. C'est le cas par exemple dans le domaine scolaire où des étudiants s'en sont servi pour faire leurs devoirs, tandis que les enseignants commencent seulement à considérer leur impact et leur rôle dans l'éducation.
Les avis sont partagés. Certains pensent que la technologie peut affiner les compétences rédactionnelles, tandis que d'autres la considèrent comme un outil de tricherie.
À en croire des témoignages de professeurs d'université, les étudiants confient à ChatGPT la résolution de leurs devoirs de maison, notamment en dissertation. « Le monde universitaire n'a rien vu venir. Nous sommes donc pris au dépourvu », explique Darren Hudson Hick, professeur adjoint de philosophie à l'université Furman.
« Je l'ai signalé sur Facebook, et mes amis [professeurs] ont dit : "ouais ! J'en ai attrapé un aussi" », a-t-il ajouté. Au début du mois, Hick aurait demandé à sa classe d'écrire un essai de 500 mots sur le philosophe écossais du 18e siècle David Hume et le paradoxe de l'horreur, qui examine comment les gens peuvent tirer du plaisir de quelque chose qu'ils craignent, pour un test à la maison. Mais selon le professeur de philosophie, l'une des dissertations qui lui sont parvenus présentait quelques caractéristiques qui ont "signalé" l'utilisation de l'IA dans la réponse "rudimentaire" de l'étudiant. Hick explique que cela peut être détecté par un œil avisé.
« C'est un style propre. Mais il est reconnaissable. Je dirais qu'il écrit comme un élève de terminale très intelligent », a expliqué Hick à propos des réponses apportées par ChatGPT aux questions. « Il y avait une formulation particulière qui n'était pas fausse, mais juste étrange. Si vous deviez enseigner à quelqu'un comment écrire des essais, c'est ce que vous lui diriez avant qu'il crée son style », a-t-il ajouté. Malgré sa connaissance de l'éthique du droit d'auteur, Hick a déclaré qu'il était presque impossible de prouver que le document avait été concocté par ChatGPT. Le professeur affirme avoir fait appel à un logiciel de vérification de plagiat. Mais les outils traditionnels de vérification de plagiat ne sont pas efficaces dans la mesure où le texte est original.
Être capable de distinguer l'écriture produite par un humain ou une machine changera la façon dont ils peuvent être utilisés dans le milieu universitaire. Les écoles seraient en mesure d'appliquer plus efficacement l'interdiction des essais générés par l'IA, ou peut-être seraient-elles plus disposées à accepter des articles si elles pouvaient voir comment ces outils peuvent aider leurs élèves.
Des sources ont rapporté au cours des dernières semaines que des écoles de Californie, de New York, de Virginie et de l'Alabama ont banni l'utilisation des outils d'IA tels que ChatGPT et ont bloqué l'accès des étudiants sur les réseaux publics. Les départements de l'éducation ne savent pas exactement quelles politiques devraient être introduites pour réglementer l'utilisation des systèmes d'IA de génération de texte. En outre, toutes les règles seraient de toute façon difficiles à appliquer.
Hive Moderation se lance dans la détection de texte généré par IA
C'est dans ce contexte qu'on commencé à être proposées des solutions visant à détecter si du texte est générée par IA. L'une d'elle est proposée par Hive Moderation. Hive Moderation est un outil qui permet la modération automatique de contenus. Cette solution vise à protéger votre plateforme des contenus visuels, audio et texte inappropriés. L’outil dispose d’une suite de modération de contenu.
Les principales fonctionnalités de Hive Moderation sont les suivantes :
- Modération de contenus visuels : l’outil prend en charge tous types de contenu visuel (images, vidéos, GIF, Webp) et dispose de 25 sous-filtres, dans 5 types de contenus distincts (NSFW, violence, drogue, incitation à la haine, images animées).
- Modération de contenus audio : la solution applique une transcription et modération des contenus audio en temps réel. Elle dispose de filtres précis qui permettent de détecter des contenus audio à caractère sexuel, liés à la violence, au harcèlement, aux discours de haine ou encore au spam.
- Modération de contenus textuels : Hive Moderation dispose d’une compréhension humaine du contenu textuel. L’outil est en mesure de prendre en charge une chaîne de caractères (jusqu’à 1024 caractères), en français, anglais, espagnol, allemand. Il peut également analyser le texte dans les images (memes, GIF, captures d’écran).
- Tableau de bord : vous accédez à un tableau de bord qui vous permet de configurer des actions de modération personnalisées. Vous pouvez ainsi définir des règles pour agir automatiquement sur le contenu non approuvé et les utilisateurs qui ne respectent pas les conditions de votre plateforme. Vous identifiez et supprimez les spams, les messages signalés et les noms d’utilisateurs en fonction de leur historique de publication.
À cette liste vient s'ajouter la détection de texte généré par IA. Hive Moderation décrit un fonctionnement est relativement simple. Vous prenez le texte supposé généré automatiquement que vous fournissez en entrée à l'outil, le modèle d'Hive Moderation décompose l'entrée en sections plus petites et analyse chacune pour déterminer si elle est générée par l'IA ou écrite par l'homme : « Nos résultats sont complets, y compris les prédictions et les scores de confiance pour le texte dans son ensemble et chaque segment plus petit qu'il contient ».
Cet outil, note Hive Moderation, peut-être utilisé à plusieurs fins :
- détecter le plagiat : les programmes éducatifs peuvent facilement identifier quand les étudiants utilisent l'IA pour tricher sur les devoirs
- promulguer des interdictions à l'échelle du site : les plateformes numériques peuvent filtrer le contenu textuel au fur et à mesure qu'il est publié pour faire respecter les interdictions sur les médias générés par l'IA
- créer de nouveaux filtres : Les plateformes sociales peuvent identifier et étiqueter le texte généré par l'IA, permettant aux utilisateurs de choisir de le filtrer de leurs flux
D'autres outils qui aident à détecter le texte généré par l'IA
Détecteur de sortie GPT-2
OpenAI impressionne Internet avec ses efforts pour reproduire l'intelligence humaine et les capacités artistiques depuis 2015. Mais en novembre dernier, la société est finalement devenue méga-virale avec la sortie du générateur de texte AI ChatGPT. Les utilisateurs de l'outil bêta ont publié des exemples de réponses textuelles générées par l'IA à des invites qui semblaient si légitimes qu'elles ont semé la peur dans le cœur des enseignants et ont même fait craindre à Google que l'outil ne tue son activité de recherche.
Si les ingénieurs d'OpenAI sont capables de créer un bot qui peut écrire aussi bien ou mieux que l'humain moyen, il va de soi qu'ils peuvent également créer un bot qui est meilleur que l'humain moyen pour détecter si le texte a été généré par IA.
La démo en ligne du modèle de détecteur de sortie GPT-2 vous permet de coller du texte dans une boîte et de voir immédiatement la probabilité que le texte ait été écrit par l'IA. Selon les recherches d'OpenAI, l'outil a un taux de détection relativement élevé, mais « doit être associé à des approches basées sur les métadonnées, au jugement humain et à l'éducation du public pour être plus efficace ».
GLTR (Giant Language model Test Room)
Lorsque OpenAI a publié GPT-2 en 2019, les gens du MIT-IBM Watson AI Lab et du Harvard Natural Language Processing Group ont uni leurs forces pour créer un algorithme qui tente de détecter si le texte a été écrit par un bot.
Un texte généré par ordinateur peut sembler avoir été écrit par un humain, mais un écrivain humain est plus susceptible de sélectionner des mots imprévisibles. En utilisant la méthode « il en faut un pour en connaître un », si l'algorithme GLTR peut prédire le mot suivant dans une phrase, alors il supposera que cette phrase a été écrite par un bot.
GPTZero
Durant la période des fêtes de fin d'années, Edward Tian était occupé à créer GPTZero, une application qui peut aider à déterminer si le texte a été écrit par un humain ou un bot. En tant qu'universitaire à Princeton, Tian comprend comment les professeurs d'université pourraient avoir un intérêt direct à détecter un « AIgiarism », ou un plagiat assisté par IA.
Tian dit que son outil mesure le caractère aléatoire des phrases ("perplexité") plus le caractère aléatoire global ("burstiness") pour calculer la probabilité que le texte ait été écrit par ChatGPT. Depuis qu'il a tweeté à propos de GPTZero le 2 janvier, Tian dit qu'il a déjà été approché par des sociétés à capital risque souhaitant investir et qu'il développera bientôt des versions mises à jour.
Le service antiplagiat Turnitin
Turnitin a récemment mis en ligne une démo de sa technologie. Dedans, Turnitin a montré le nombre de phrases dans certains échantillons de dissertations qui ont été écrites par une IA (24 sur 24 dans un cas) et a mis en évidence le texte dans différentes nuances pour indiquer les parties écrites par l'IA et les parties partiellement écrites par l'IA. Annie Chechitelli, directrice des produits chez Turnitin, a déclaré que l'entreprise construit discrètement son logiciel de détection depuis des années, notamment depuis la sortie de GPT-3 en 2020. GPT-3 est un grand modèle de langage développé par OpenAI, avec environ 175 milliards de paramètres.
L'outil est toujours en développement, mais Turnitin espère lancer son logiciel au cours du premier semestre de cette année. « Il s'agira d'une détection assez basique au début, puis nous lancerons des versions rapides ultérieures qui créeront un flux de travail plus exploitable pour les enseignants », a déclaré Chechitelli. Le plan est de rendre le prototype gratuit pour ses clients existants à mesure que la société recueille des données et des commentaires des utilisateurs. La ruée pour donner aux éducateurs la capacité d'identifier les textes écrits par des humains et des ordinateurs s'est intensifiée avec le lancement de ChatGPT fin novembre 2022.
« Au début, nous voulons vraiment aider le secteur et aider les éducateurs à prendre leurs marques et à se sentir plus confiants. Et obtenir le plus d'utilisation possible dès le début ; c'est important pour faire un outil réussi. Plus tard, nous déterminerons comment nous allons le produire », a-t-elle ajouté. Bien que le texte généré par l'IA soit convaincant, il existe des signes révélateurs de l'œuvre d'une IA : elle est souvent fade et sans originalité ; des outils comme ChatGPT régurgitent des idées et des points de vue existants et n'ont pas de voix distincte. Les humains peuvent repérer les textes générés par l'IA, mais cela devient de plus en plus difficile.
Toutefois, les machines sont bien meilleures pour cela. Eric Wang, vice-président de l'IA chez Turnitin, note que les ordinateurs peuvent détecter des modèles évidents dans les textes produits par l'IA. « Même si nous avons l'impression que cela ressemble à de l'œuvre d'un humain, [les machines écrivent en utilisant] un mécanisme fondamentalement différent. Elles choisissent le mot le plus probable à l'endroit le plus probable, et c'est une façon très différente de construire le langage par rapport à vous et moi », a-t-il déclaré à The Register. L'outil de Turnitin semble baser son fonctionnement sur la façon dont les humains lisent et écrivent les textes.
Wang explique : « nous lisons en faisant des allers-retours avec nos yeux sans même le savoir, ou en papillonnant entre les mots, entre les paragraphes, et parfois entre les pages. Nous avons aussi tendance à écrire avec un état d'esprit futur. Je peux être en train d'écrire, et je pense à quelque chose, un paragraphe, une phrase, un chapitre ; la fin de la rédaction est liée dans mon esprit à la phrase que je suis en train d'écrire, même si les phrases entre maintenant et alors n'ont pas encore été écrites ». D'après Wang, ChatGPT, en revanche, ne dispose pas de ce type de flexibilité et ne peut générer de nouveaux mots qu'à partir de phrases précédentes.
Le détecteur de Turnitin fonctionne en prédisant quels mots l'IA est plus susceptible de générer dans un extrait de texte donné. « C'est très fade sur le plan statistique. Les humains n'ont pas tendance à utiliser systématiquement un mot à forte probabilité dans des endroits à forte probabilité, mais GPT-3 le fait, et notre détecteur s'en aperçoit vraiment », a-t-il déclaré. Wang a déclaré que le détecteur est basé sur la même architecture que GPT-3 et l'a décrit comme une version miniature du modèle. Selon lui, à bien des égards, il s'agit de combattre le feu par le feu. Il y a un composant de détection attaché au lieu d'un composant de génération.
Filigrane (à venir)
En plus d'aborder le problème comme les détecteurs de plagiat l'ont fait dans le passé, OpenAI tente de résoudre le problème en filigranant tout le texte ChatGPT. Selon une récente conférence sur la sécurité de l'IA par le chercheur invité d'OpenAI, Scott Aaronson, les ingénieurs ont déjà construit un prototype fonctionnel qui ajoute un filigrane à tout texte créé par OpenAI.
« Fondamentalement, chaque fois que GPT génère un texte long, nous voulons qu'il y ait un signal secret autrement imperceptible dans ses choix de mots, que vous pouvez utiliser pour prouver plus tard que, oui, cela vient de GPT », explique Aaronson. L'outil utiliserait ce qu'il appelle une « fonction cryptographique pseudo-aléatoire ». Et seul OpenAI aurait accès à cette clé.
Le public est plutôt sceptique concernant l'efficacité de tels outils
« Ce qui est amusant avec des détecteurs dits précis, c'est qu'ils peuvent être utilisés de manière défavorable pour former le modèle d'origine afin de générer un contenu indétectable », note un internaute. Lui faisant écho, un autre déclare « Fondamentalement, le détecteur est un "banc d'essai" pour le générateur. Le générateur peut créer quelque chose, voir si le détecteur le détecte comme étant créé par l'IA, puis adapter le contenu jusqu'à ce que le détecteur ne soit pas en mesure de faire la différence entre le contenu créé par l'homme et celui créé par l'IA ».
D'autres préfèrent y aller sur une note d'humour : « Tout cela se transforme en un cercle entier d'IA. A la fin l'IA se détruira avant la singularité ».
Et d'autres encore tentent de démontrer l'absurdité du système : « Je viens d'effacer l'invite du système solaire [ndlr. dans la démo, Hive Moderation a écrit un texte sur le système solaire] et j'ai écrit la mienne en énumérant simplement les planètes et ce que sont les systèmes solaires. 96 % de probabilité d'IA. Est-il précis à 99 % pour détecter l'IA tout en sachant que ce n'est pas de l'IA ? »
Source : Hive Moderation
Et vous ?
Partagez-vous les avis de ceux qui pensent que ces outils ne sont pas au point et que, de toutes façons, les IA génératives seraient entraînés à les battre, créant ainsi un « cercle vicieux » ?