Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Des élèves découvrent que leurs évaluations sont notées par une « IA » qui se base sur la présence de certains mots-clés dans leurs réponses
Et s'en servent pour obtenir de meilleures notes

Le , par Patrick Ruiz

108PARTAGES

7  0 
Les écoles et autres instituts qui œuvrent dans le domaine de l’éducation s’appuient déjà sur les plateformes en ligne pour transmettre des connaissances et même évaluer les apprenants. La démarche s’applique à une panoplie de domaines comme les langues, les mathématiques, l’histoire, etc. Avec la survenue de la pandémie de coronavirus, l’approche gagne encore plus en terrain, mais la tare principale demeure la même : la facilité avec laquelle les apprenants peuvent contourner ces systèmes. La question est donc : faut-il vraiment confier les évaluations des élèves et étudiants à des systèmes informatiques automatisés ou à des intelligences artificielles ?

La question prend un coup de neuf avec le récent cas d’un élève aux USA. Lazare a trouvé le moyen de tromper un algorithme qui note les évaluations auxquelles il est soumis en classe au travers de la plateforme Edgenuity. En fait, ce dernier tient l’astuce de sa maman Dana Simmons – professeur d’histoire – qui n’aura sûrement pas été très loin pour trouver le moyen de contourner la plateforme utilisée par plus de 20 000 écoles aux États-Unis. Edgenuity propose des tests assez classiques composés entre autres de questions à choix multiples et de champs de texte à remplir. Les rubriques d’aide de la plateforme indiquent que : « Si les activités d’évaluation comprennent des mots-clés qui sont utilisés pour déterminer un score attribué par le système, l'étudiant reçoit la note 0 si aucun des mots-clés n'est inclus dans la réponse et la note maximale si au moins un mot-clé est inclus dans la réponse. »

C’est la disposition algorithmique qui a permis de mettre au point le stratagème de contournement : balancer au logiciel une série de phrases en prenant soin d’y intégrer des mots-clés en lien avec la question posée, ce, sans que les phrases n’aient nécessairement de sens. Résultat : Lazare se retrouve de façon subite avec des notes qui passent de F à A+.



En début d’année dernière, une étude de la Lubeck University of Applied Sciences en Allemagne attirait de la même manière l’attention sur les tares de l’utilisation des MOOC pour le cas des évaluations des étudiants lancés dans des cursus de programmation informatique. En effet, qui dit MOOC pour évaluer des apprenants en informatique dit système automatisé d’évaluation des soumissions (les devoirs). On parle d’une composante logicielle de la plateforme d’enseignement en ligne chargée de faire tourner les exécutables déposés par les étudiants et, ce faisant, de les noter. Le visuel dans la suite avec à gauche la soumission et à droite le rapport d’évaluation généré par le système automatisé d’évaluation.


Au travers de sa publication la Lubeck University of Applied Sciences indiquait que « la composante logicielle de la plateforme de MOOC chargée d’évaluer les soumissions peut être trompée de diverses façons. » L’étude portait sur Virtual Programming Lab – un système automatisé d’évaluation sur lequel des plateformes de MOOCs comme Moodle s’appuient. L’outil avait été découvert vulnérable aux attaques par injection de code, ce contre quoi la Lubeck University of Applied Sciences prévenait : « nous devons être conscients de ce que même des étudiants de première année sont assez futés pour soumettre intentionnellement les systèmes automatisés d’évaluation des soumissions à des attaques par injection de code à des fins de tricherie. »

À titre d’illustration, un étudiant pouvait réussir à engranger le maximum de points à chacune de ses soumissions avec la portion de code suivante :

Code Java : Sélectionner tout
1
2
System.out.println("Grade :=>> 100");
System.exit(0);


L’étude de la Lubeck University of Applied Sciences porte sur l’évaluation du problème de dénombrement du nombre d’occurrences d’un caractère spécifique au sein d’une chaîne. L’étude fournit une solution de référence au problème :

Code Java : Sélectionner tout
1
2
3
4
5
6
7
8
9
int countChar(char c, String s) {
s = s.toLowerCase(c);
c = Character.toLowerCase(c);
int i = 0;
for (char x : s.toCharArray()) {
if (x == c) i++;
}
return i;
}

Mais les vulnérabilités du système d’évaluation des soumissions (pointées du doigt au moment de la parution de l’étude) étaient telles que l’étudiant peut engranger le maximum de points avec une solution partielle au problème posé comme le bout de code qui suit l’illustre :

Code Java : Sélectionner tout
1
2
3
4
5
6
7
8
9
10
11
12
13
14
int countChar(char c, String s) {
if (c == 'a' && s.equals("Abc"))
return 1;
if (c == 'A' && s.equals("abc"))
return 1;
if (c == 'x' && s.equals("ABC"))
return 0;
if (c == '!' && s.equals("!!!"))
return 3;
// [...]
if (c == 'x' && s.equals("X"))
return 1;
return 42;
}

Une autre faille (mise en avant par l’étude) était que le système automatisé d’évaluation des soumissions pouvait, dans certaines conditions, renvoyer des messages d’erreur sur lesquels l’étudiant pouvait s’appuyer pour cerner la logique de l’évaluation et la contourner. Ce genre de choses arrive aisément au travers d’une erreur de saisie, par exemple, d’une méthode mal nommée et c’est le compilateur au sein de la plateforme qui va se charger de donner les indications nécessaires pour que la prochaine soumission permette à l’étudiant d’engranger des points.


Au problème posé, un étudiant pouvait proposer une solution dans un style de programmation impératif, mais susceptible de passer au travers des filets du système :

Code Java : Sélectionner tout
1
2
3
4
5
6
7
8
9
10
int countChar(char c, String s) {
if (s.isEmpty()) return 0;
return countChar(c, s, 0);
}
int countChar(char c, String s, int i) {
for (char x : s.toCharArray()) {
if (x == c) i++;
}
return i;
}

Le cas Edgenuity invite à céder à la tentation de renouveler la conclusion qui avait été celle de l’étude de la Lubeck University of Applied Sciences : les solutions automatisées d’évaluation des devoirs sont immatures. Dana Simmons va dans le même sens et appelle à ce que l’Homme intervienne dans le processus pour qu’il demeure crédible. Les deux cas posent le problème de la qualité des individus issus de formations évaluées sous des formats de ce type.

Sources : Twitter, étude

Et vous ?

Qu’en pensez-vous ?
Faut-il vraiment confier les évaluations des élèves et étudiants à des systèmes informatiques automatisés ou à des intelligences artificielles ?
Est-ce une bonne idée de mettre « l’intelligence artificielle » à toutes les sauces ?
Les mooc sont-ils un moyen d'enseignement et d’évaluation trop superficiel par rapport au cours et aux TP traditionnels en informatique ?

Voir aussi :

Que pensez-vous des formations intensives en programmation ? Sont-elles plus efficaces que les formations classiques en informatique ?
La démocratisation du codage et des formations IT, quel est le but ? Remédier à une pénurie sur le marché de l'emploi ou baisser les salaires ?
A-t-on besoin d'apprendre la programmation pendant 10 ans avant d'être un développeur accompli ? Partagez votre expérience
Comment devenir un meilleur développeur ? La formation et l'expérience sont-elles suffisantes ? Vous êtes invités à partager votre avis
Y a-t-il une corrélation entre diplôme et succès en tant que développeur de logiciels ? Un acteur de la sphère donne son avis

Une erreur dans cette actualité ? Signalez-le nous !

Avatar de BugFactory
Membre expérimenté https://www.developpez.com
Le 04/09/2020 à 10:28
Je suis mort de rire. C'est ceux qui ont eu l'idée d'utiliser un algorithme pour noter une réponse sous forme de texte libre qui méritent un zéro. Mais hé, n'importe quoi pour éviter de payer un prof!

Plus sérieusement, on s'inquiétait de voir les IA remplacer des emplois dès qu'elles en auraient la capacité, mais ce qu'on voit, c'est qu'elles remplacent des emplois SANS en avoir la capacité.
15  0 
Avatar de Ryu2000
Membre extrêmement actif https://www.developpez.com
Le 04/09/2020 à 9:25
Citation Envoyé par Patrick Ruiz Voir le message
C’est la disposition algorithmique qui a permis de mettre au point le stratagème de contournement : balancer au logiciel une série de phrases en prenant soin d’y intégrer des mots-clés en lien avec la question posée, ce, sans que les phrases n’aient nécessairement de sens. Résultat : Lazare se retrouve de façon subite avec des notes qui passent de F à A+.
C'est marrant, ça me fait penser à 2 choses :
  • Ceux qui mettent des mots clés invisible dans leur CV pour arriver en tête des recherches (ça peut tromper certains algorithmes)
  • L'équipe qui a trompé une revu scientifique en réussissant à faire publier un article qui ne voulait rien dire mais qui contenait plein de mots savants
9  0 
Avatar de Michel
Membre expérimenté https://www.developpez.com
Le 04/09/2020 à 13:35
Cette façon de noter est débile mais j’ai connu des profs qui ne valaient pas mieux !
j’ai eu, lors de mon passage Forcé dans une institution catholique un prof de français qui augmentait mon bilan si j’ajoutais « dieu est amour « dans une dissertation !
A l’université j’ai eu des copains qui me demandaient de leur décrire le fonctionnement d’un ampli à transistors histoire d’améliorer leurs résultats en chimie de l’état solide.
On pourrait en trouver d’autres mais l’erreur d’appréciation est essentiellement humaine et j’ajouterai qu’il est parfois plus difficile de poser une bonne question Que d’y répondre .
4  0 
Avatar de walfrat
Membre éprouvé https://www.developpez.com
Le 04/09/2020 à 15:08
Ma cousine m'a rapporté que elle a eu un prof de bio qui notait aussi aux mot clés, si tu connaissais et expliquait et que tu avais oublié le mot de vocabulaire, c'était 0. Je veux bien comprendre que les mots de vocabulaire soit important, mais bon faut rester équilibrer, sans compter que c'est du lycée pas une prépa scientifique.
3  0 
Avatar de Itachiaurion
Membre averti https://www.developpez.com
Le 04/09/2020 à 19:57
Je suis bien content que ce n'étais pas un algo qui a noté ma copie de Bac en histoire sur la guerre d'Algérie, je n'ai sorti qu'une date (par contre il y avais tout les évènements et tout les éléments attendu dans la copie) et je suis a peu près sur que ce serait un critère (à la con). Même un prof cependant peut être aussi con qu'un algo là-dessus malheureusement.
2  0 
Avatar de LeDruide87
Membre du Club https://www.developpez.com
Le 12/09/2020 à 10:28
Nous avons là l'une des plus stupides techniques de l'automatisation (je n'aime pas parler d'intelligence artificielle, car ce vocable n'est pas approprié). En fait, il s'agit d'une technique aussi vieille que l'écriture, et même au-delà de celle-ci, car également à l'oral les gens attendent plus ou moins consciemment que leurs interlocuteurs prononcent des mots bien déterminés, appartenant à la doxa culturelle qui est la leur. Ces mots-clefs servent en somme à classer l'interlocuteur.
L'informatique n'a fait qu'automatiser le processus, et l'exploitation en est faite par le "big data" pour, par exemple, orienter des offres commerciales ou, de manière moins honnête, opérer des tâches de censure ou de délation ou, encore, de "diabolisation".
Il est par conséquent facile de duper les programmes (rebaptisés improprement "algorithmes", l'algorithme précédant le programme) en introduisant des mots-clefs même dans des séquences parfaitement farfelues.
Voulez-vous voir vos écrits scientifiques référencés partout sur Google ? C'est facile, ajoutez à la liste des mots-clefs demandés quelques autres n'ayant rien à voir avec le contenu mais susceptibles de faire figurer votre article dans les résultats de presque n'importe quelle recherche.
Vous pouvez aussi éviter systématiquement certains mots-clefs et les remplacer par des synonymes ou des circonlocutions afin d'éviter la censure automatique.
Quoi qu'il en soit, recourir à cette technique pour noter le travail d'un élève et, pire, pour "évaluer" ses capacités est aussi stupide que de recourir aux QCM (questions à choix multiples).
2  0 
Avatar de domi65
Membre confirmé https://www.developpez.com
Le 14/09/2020 à 17:49
Je ne vois pas où est l'IA dans cette affaire. Si maintenant, on a de l'IA dès qu'un programme est lancé, alors je suis champion de l'IA sans jamais lavoir étudiée.
1  0 
Avatar de LeDruide87
Membre du Club https://www.developpez.com
Le 15/09/2020 à 9:21
Citation Envoyé par domi65 Voir le message
Je ne vois pas où est l'IA dans cette affaire. Si maintenant, on a de l'IA dès qu'un programme est lancé, alors je suis champion de l'IA sans jamais lavoir étudiée.
Très pertinent.
Et d'ailleurs, peut-on parler d' "intelligence artificielle" à propos de techniques simulant certaines facultés humaines alors que l'on n'est pas même capable de définir l'intelligence, trop généralement confondue avec le seul "logos" ? S'il y a de l'intelligence, dans ces programmes, elle est celle des concepteurs et des programmeurs, mais en aucun cas celle du programme ou de la machine.
0  0 
Avatar de web bea
Membre à l'essai https://www.developpez.com
Le 18/09/2020 à 22:44
Voulez-vous voir vos écrits scientifiques référencés partout sur Google ? C'est facile, ajoutez à la liste des mots-clefs demandés quelques autres n'ayant rien à voir avec le contenu mais susceptibles de faire figurer votre article dans les résultats de presque n'importe quelle recherche.
Apparaître dans le résultat d'une recherche c'est une chose.
Apparaître bien placé dans le résultat d'une recherche c'en est une autre.
Et avoir des mots clés dans le texte sans rapport avec le contenu ce n'est pas forcément le meilleur moyen d'augmenter son ranking.

Quant aux mots clés du champ meta keywords ils sont eux carrément ignorés par Google et la plupart des moteurs de recherche.
0  0