Les 7 péchés capitaux des intelligences artificielles génératives

J’avais déjà écrit un article Les 7 principaux réseaux sociaux et leurs péchés capitaux ou défis à surmonter pour le blog de L’annuaire digital. Le boom des IA génératives laisse aussi planer, avec cette course sans fin entre les acteurs américains, chinois et les autres (avec en première ligne Mistral.AI chez nous) qui ramassent les miettes, un risque de bulle IA. Aussi voici les 7 péchés capitaux dont il convient d’avoir conscience en tant qu’utilisateur dans les sphères professionnelles et personnelles.

  • 1. Les hallucinations où les IA inventent du contenu, ce qui induit en erreur si on n’y prend pas garde et si l’on n’effectue pas de retraitement humain. On observera que ChatGPT même en version 5 en produit davantage en moyenne que d’autres LLM (Large Language Models) comme Perplexity ou Grok. Contrairement à un humain, une IA a du mal à reconnaître qu’elle ne sait pas. Elle préfère produire une réponse, même incertaine, plutôt que d’admettre son ignorance. Celle-ci sera non exacte mais probabiliste. En outre les IA génératives présentent les réponses comme si c’étaient des vérités absolues y compris pour des informations incertaines ou incomplètes ;
  • 2. Les biais du fait des données d’entraînement qui peuvent comporter des déséquilibres ou des stéréotypes (par ex. genre sur-représenté, absence de réponses factuelles à des sujets clivants, informations pour être dans du politiquement correct voire véhiculer des idées). De fait cela est ensuite reproduit par les IA. En outre la suppression de signaux faibles qui peuvent être fiables est également possible. Ceci efface des idées innovantes, des perspectives certes minoritaires mais qui aurait du sens notamment en matière de veille stratégique et d’analyse prospective ;
  • 3. Le manque de bon sens ou non-compréhension pratique. Les LLM ne comprennent pas le monde tel que nous le connaissons et le contextualisons. Ils effectuent des corrélations linguistiques par rapport à des voisinages de mots qui ne sont que statistiques. Aussi des réponses plausibles mais absurdes peuvent être générées. Ils n’ont pas conscience des conséquences dans la vie physique qui résulteraient de leurs suggestions ;
  • 4. L’absence de mention précise des sources. En effet au début ChatGPT 3.5 donnait des réponses sans préciser les sources. Désormais la plupart des LLM les mentionnent mais celles-ci restent très grossières comme l’URL racine du site tout simplement et non la page elle-même, par exemple www.lequipe.fr et non l’article précis qui a alimenté la réponse. Ceci induit un sérieux problème de traçabilité et de vérification des réponses générées notamment dans des domaines sensibles comme la médecine, les sciences ou l’actualité et le monde de la recherche où les références précises sont nécessaires et font partie de la crédibilité des acteurs ;
  • 5. Le caractère peu innovant avec l’absence de rupture dans les contenus. Les IA recombinent intelligemment l’existant sans toutefois créer une nouveauté originale. Ceci vaut aussi pour les IA génératives créant des images, des vidéos et du son. Les données d’entrainement limitent l’innovation vraie en se contentant simplement d’imiter ;
  • 6. La très grande consommation énergétique du fait d’un besoin colossal de données tant pour les entraînements que pour la production de résultats en réponse à un prompt. Ceci génère un fort besoin en datacenters, en centrales nucléaires d’autant plus que les nouvelles versions des IA génératives sont dans le « toujours plus de données ». Il conviendrait plutôt de s’orienter vers du mieux avec moins, d’où un nécessaire changement de paradigme avec par exemple les SLM (Small Language Models) même si le recours à des RAG (Retrieval-Augmented Generation) est bénéfique et limite par ailleurs les hallucinations ;
  • 7. Le risque de « soleil vert des données » ou de « vache folle » des données avec une dégénérescence ou des données dérivées elles-mêmes issues de données produites par des IA génératives. Certains parlent même de « model collapse » avec des entraînements des modèles effectués avec des données synthétiques produites par d’autres IA. Au fil des générations, la qualité des modèles d’IA se dégrade (amplification des biais, perte de diversité, uniformisation des résultats produits, plus grande incohérence des résultats).

Dans ce contexte, le contenu de qualité et exclusif produit par des humains et de très grande valeur pour éviter de tourner en rond et ouvrir les chakras est salvateur. L’ajout régulier de contenu produit par les humains (sur les blogs, sites, réseaux sociaux, forums de discussion, etc.) est précieux et devrait être valorisé. Pourquoi ne pas taxer les IA pour financer les producteurs de contenu humains ? Cela revient à taxer les robots qui prennent le travail des ouvriers. En l’espèce nous sommes des ouvriers de la donnée, de la connaissance, les cols blancs ubérisés, aujourd’hui les jeunes diplômés du supérieur, demain tout le monde. Le recours à des outils de détection de données produites avec des IA génératives peut également être une piste en renforcement si j’ose dire.

Il convient également de rester acteur de l’information produite en la mettant en doute, la challengeant. Plus que jamais dans l’ère de l’IA générative, on a envie de dire (et de lire) Informez-vous ! Il est possible de faire vérifier le contenu produit par une IA en le confrontant à une autre IA. Sans vérification on risque de laisser devenir notre cerveau paresseux et d’avoir un QI moindre. A contrario une IA utilisée avec discernement peut constituer un challenge et un boost pas seulement pour votre productivité mais pour votre intellect lui-même.

Et si finalement face à l’inflation des contenus générés, la véritable rareté devenait l’intelligence humaine, critique et incarnée ?

1 ping

  1. […] vous fûtes nombreux à apprécier mon article Les 7 péchés capitaux des intelligences artificielles génératives, voici le pendant tel le yin et le yang. Je présente ici 7 opportunités concrètes des IA […]

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée.

Captcha *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.