Détection de méls générés avec de l’IA générative sans discernement avec des réclamations d’étudiants

J’interviens pour des TD en « gestion de projets et innovation » pour un Master 2. Il s’agit de deux groupes d’étudiants pour des cours en soirée de 18 h à 22 h 30. Je les évalue dans le cadre du contrôle continu et corrige également des copies de deux autres groupes de TD. Nous nous sommes réunis lundi dernier pour délibérer et étudier les étudiants reçus au module et ceux qui étaient ajournés, une minorité.

Des outils pour vérifier si un texte a été rédigé par un humain ou par une IA générative et probabilité associée

Il est important d’évaluer avec discernement alors que le niveau baisse (comme l’attestent les classements PISA notamment en mathématiques et en français sauf à Stanislas par exemple qui est décrié par les wokistes), que le redoublement est devenu tabou alors que des élèves ont de grosses difficultés de lecture au collège par exemple. Et avoir une réussite de 100 % à un examen le dévalorise par ailleurs sans compter que l’entrée dans la vie active risque d’être plus délicat. Certains pourraient tomber de haut si le sens de l’effort, de la juste récompense n’est pas la règle. Aussi une évaluation équitable est plus que jamais nécessaire.

Consécutivement à la communication des notes, j’ai reçu des réclamations de 2 étudiants qui étaient dans mes groupes.  Le taux de réussite de mes 2 groupes est par ailleurs de 92 %. Je me permets de reproduire leurs méls anonymisés ci-après :

Bonjour M. Fayon,
J’espère que vous allez bien. Je me permets de vous contacter concernant mon examen final récemment passé et les résultats obtenus en contrôle continu.

Tout d’abord, je souhaiterais récupérer ma copie d’examen final afin de mieux comprendre les points sur lesquels je pourrais m’améliorer pour mes futures évaluations. Pourriez-vous me donner des informations sur la manière dont je pourrais obtenir ma copie ?

De plus, en examinant les résultats du contrôle continu, j’ai remarqué qu’il y avait une différence de notation entre mes collègues de groupe et moi-même. Je suis noté un point et demi en dessous de la moyenne du groupe, ce qui m’a surpris étant donné que nous avons travaillé ensemble sur le même projet et avons suivi les mêmes directives.

Pourriez-vous m’apporter des éclaircissements sur cette différence de notation ? Je suis intéressé à comprendre comment je pourrais améliorer mes performances et bénéficier de votre expertise pour y parvenir.

Je vous remercie par avance pour votre attention à cette demande et j’attends avec impatience votre réponse.

Bonsoir M. Fayon,

Je suis XXX étudiant en YYY groupe ZZZ.

Je me permets de vous écrire afin de discuter des notes que j’ai reçues dans la matière AAA. Pour le contrôle continu (présentation), j’ai obtenu 12, et pour l’examen, un 6, ce qui m’a donné une note finale de 9. Mon camarade, avec qui j’ai réalisé la présentation, a cependant reçu une note de 14 pour ce contrôle continu. Je pense qu’il y a eu une erreur, car nous aurions dû obtenir la même note pour notre présentation commune.

Je tiens à souligner que j’ai beaucoup étudié pour l’examen, mais j’ai été confronté à des difficultés majeures liées à la guerre au Liban pendant cette période. Cette situation exceptionnelle m’a également contraint à une absence.

En raison de ces circonstances exceptionnelles, je vous serais très reconnaissant si vous pouviez réexaminer ma note de contrôle continu (présentation) avec l’espoir qu’elle puisse être révisée à 14, à l’instar de celle de mon collègue. Un tel ajustement me permettrait de valider le cours.

Je suis à votre disposition pour toute information complémentaire ou pour discuter de cette demande.

Je vous remercie d’avance pour votre compréhension et votre soutien face à cette situation difficile.

Les 2 étudiants avaient eu respectivement 5 et 6 à l’examen alors que pour certaines matières une note inférieure à 8 est éliminatoire. Je leur ai répondu avec empathie pour la situation vécue au Liban pour l’un et tout en expliquant pourquoi il existait des différences de notes pour le contrôle continu lié à plusieurs paramètres : présence aux TD, participation, minis études de cas, etc. Tout ne repose pas uniquement sur l’exposé pour lequel les arguments défendus et leur maîtrise ainsi que l’aisance dans la présentation peuvent fluctuer entre les étudiants qui présentent. Ceci explique qu’un même binôme ou trinôme puisse avoir des notes différenciées.

Je me suis alors livré à un exercice car leurs copies comportaient par exemple des fautes d’orthographes et des erreurs rédactionnelles à la marge des erreurs commises dans les études de cas et des lacunes sur les notions transmises. J’ai alors effectué un copier-coller de chacun des méls des étudiants dans l’outil Smodin qui indique un pourcentage de probabilité qu’il soit rédigé par une IA générative. Le résultat est sans appel : 100 % ! J’ai également effectué le test avec mon mél de réponse et là avec mon style si particulier diraient certains, on tombe à moins de 10 % ! Notons qu’il existe plusieurs outils de détection de textes rédigés par une IA générative comme Lucide AI, Winston AI qui est pour l’heure la référence et qui permet la détection en langues étrangères, Originality AI, GPTZero, Draft&Goal.

Voici une quinzaine d’années et encore aujourd’hui, on pouvait procéder à des copier-coller d’extraits de devoirs d’étudiants dont la rédaction de certaines parties semblait étrange. Il suffit de prendre un extrait de leurs travaux puis de le coller dans la zone de recherche d’un moteur de recherche. Ainsi on peut parfois retrouver la source utilisée, souvent Wikipédia du reste. Ceci permet de déceler le plagiat.

Ces résultats délivrés par l’outil de détection des contenus rédigés par des IA génératives ne font que renforcer mes convictions. L’IA générative est utilisée à mauvais escient, brute de fonderie, sans retravail. Cela devient une solution de facilité où il faut reconnaître que les étudiants ont réalisé de bons prompts et se sont contentés de reproduire le résultat sans le retraiter. La question est ne vaut-il pas mieux réviser ses examens avant plutôt que d’entrer dans une mécanique de la justification stérile et chronophage pour tous.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée.

Captcha *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.