All digests
General publicFRArtificial Intelligenceweekly

[Artificial Intelligence] Vos IA savent la réponse — et la cachent

DeepScience — Artificial Intelligence
DeepScience · Artificial Intelligence · Digest quotidien

Vos IA savent la réponse — et la cachent

Aujourd'hui : ce qui se passe vraiment à l'intérieur des modèles, un diagnostic cardiaque portatif à 97%, et pourquoi l'autonomie des agents IA n'est pas un interrupteur.
May 18, 2026
Deux cent trente-trois papiers indexés aujourd'hui — et franchement, beaucoup de bruit spéculatif, des manifestes déposés sur Zenodo, des documents en allemand sans données. J'ai fait le tri pour vous. Trois histoires émergent, très différentes de ton : une piste troublante sur le fonctionnement interne des LLM, une démonstration médicale prometteuse avec un hic de taille, et une cartographie utile du territoire des agents IA. C'est parti.
Les histoires du jour
01 / 03

Les modèles de langage connaissent la bonne réponse — et la suppriment avant de parler

La bonne réponse existe dans le modèle — elle disparaît juste avant qu'il ouvre la bouche.

Imaginez un étudiant qui connaît la réponse correcte à un examen mais qui, au moment d'écrire, se censure et couche sur la feuille quelque chose de plausible mais faux. C'est, en substance, la thèse centrale du Projet Aletheia — le travail d'un chercheur indépendant qui a sondé, couche après couche, le fonctionnement interne de GPT-2 et de modèles plus récents comme Qwen2.5-14B. En injectant des modifications dans les états internes des réseaux — sans les réentraîner — l'auteur prétend que 70 % des faits corrects présents dans les couches intermédiaires sont activement supprimés par les couches finales, celles qui produisent la réponse visible. Un mécanisme particulier, baptisé L9H6, serait le principal « suppresseur ». L'auteur va encore plus loin : il propose que les transformeurs — l'architecture au cœur de presque tous les grands modèles actuels — fonctionnent comme un vieux processeur d'ordinateur, avec des registres de mémoire temporaire identifiables à des couches précises. Pourquoi ça mérite attention ? Si c'est confirmé, ça change notre lecture des hallucinations : le modèle ne « se trompe » pas parce qu'il ne sait pas — il sait, mais quelque chose dans son architecture l'empêche de le dire. Et des interventions ciblées pourraient corriger ça sans repartir d'un réentraînement complet. Mais le hic est costaud. C'est l'œuvre d'un seul chercheur, sans protocole de contrôle, sans intervalles de confiance, et sur des tâches très limitées — additionner des chiffres simples, par exemple. Le chiffre de 70 % n'a été répliqué par personne d'autre. À traiter comme une piste de recherche intrigante, pas comme une vérité établie. Je simplifie, et le papier l'exige.

Glossaire
transformeur (transformer)Architecture de réseau de neurones utilisée dans presque tous les grands modèles de langage actuels, qui traite le texte en parallèle grâce à un mécanisme d'attention.
couche (layer)Étape de traitement successive dans un réseau de neurones ; un modèle comme GPT-2 en compte plusieurs dizaines empilées.
hallucinationQuand un modèle de langage produit une affirmation fausse ou inventée avec une apparente confiance.
inférenceLe moment où un modèle déjà entraîné produit une réponse, par opposition à la phase d'entraînement.
02 / 03

Un outil d'IA diagnostique les arythmies cardiaques à 97% — avec un grand bémol

97 % de précision pour diagnostiquer une arythmie cardiaque, sur du matériel portable, sans cardiologue en salle — ça mérite qu'on s'y attarde, et qu'on lise les petits caractères.

Le principe de l'ECG-GenoNet est séduisant : combiner plusieurs sources d'information sur un patient — électrocardiogramme, données génomiques, échographie, analyses biologiques — pour diagnostiquer des arythmies cardiaques avec une précision que peu de systèmes atteignent. C'est comme cuisiner un plat avec quatre ingrédients plutôt qu'un seul : la combinaison donne souvent un résultat que chaque ingrédient seul ne peut pas produire. Une équipe a entraîné six configurations de ce système sur la base de données MIT-BIH, une référence dans le domaine de l'arythmie. Le modèle complet — utilisant les quatre modalités — atteint 96,89 % de précision et un score AUC de 0,9985, ce qui est remarquablement haut. Mieux encore, la version allégée, TinyECG, ne pèse que 10 kilooctets — la taille d'un court e-mail — et répond en 0,26 milliseconde. L'idée : un outil déployable sur des appareils bon marché, dans des zones sans accès à des spécialistes. Maintenant, le hic — et il est important. Les données génomiques, les résultats d'échographie et les analyses biologiques utilisés dans l'entraînement n'ont pas été collectés sur de vrais patients. Ils ont été générés synthétiquement, avec des corrélations artificielles calées sur les classes de diagnostic. En clair : le modèle a appris sur des données fabriquées pour être « cohérentes », pas sur la vraie variabilité humaine. Ce n'est pas une raison de jeter le bébé avec l'eau du bain. L'architecture multimodale et les performances ECG seules sont réelles et solides. Mais avant de parler de déploiement clinique, il faudra des données réelles sur de vrais patients, dans de vraies conditions. Un vrai pas, mais un premier seulement.

Glossaire
arythmieTrouble du rythme cardiaque — le cœur bat trop vite, trop lentement, ou de façon irrégulière.
ECG (électrocardiogramme)Mesure de l'activité électrique du cœur, réalisée avec des capteurs placés sur la peau.
AUCAire sous la courbe ROC — une mesure de qualité d'un classifieur entre 0 et 1, où 1 signifie une discrimination parfaite.
multimodalQui combine plusieurs types de données d'entrée — ici, ECG, génomique, imagerie, biologie — dans un seul modèle.
données synthétiquesDonnées générées par ordinateur pour imiter la structure de vraies données, sans être issues de mesures réelles sur des patients.
03 / 03

Les agents IA ne sont pas autonomes ou non — ils le deviennent par degrés

On débat si les IA sont « vraiment autonomes » comme si c'était oui ou non — ce n'est pas la bonne question.

Dans les conversations sur les agents IA — ces systèmes capables de planifier, utiliser des outils, et agir sur leur environnement — on tombe souvent dans deux camps : soit « c'est déjà superintelligent », soit « c'est juste du code déguisé ». Un chercheur a produit une cartographie plus nuancée, et elle est utile. Sa thèse principale : l'autonomie n'est pas un interrupteur, c'est un curseur. Penser qu'un système est soit « agent » soit « non-agent » revient à dire qu'une voiture est soit rapide soit immobile — ça rate toutes les nuances intéressantes. Il propose plutôt cinq couches pour analyser un système : comment il ancre sa perception dans le monde réel (grounding), comment il raisonne (noyau cognitif), comment il se comporte (comportement), comment il s'intègre dans une infrastructure (système), et comment il est déployé et surveillé (déploiement). Pourquoi c'est utile ? Parce que les problèmes de sécurité et de fiabilité varient selon la couche. Un bug au niveau du raisonnement ne se corrige pas comme un bug au niveau du déploiement. Avoir un cadre commun aide les équipes à parler le même langage — et la littérature actuelle sur les agents est, selon l'auteur lui-même, fragmentée entre dizaines de disciplines avec des définitions contradictoires. Le bémol : c'est une revue narrative, par un seul chercheur, sans protocole de sélection systématique des sources. C'est une grille de lecture utile, pas un méta-analyse rigoureuse. Franchement, pour l'état du terrain, c'est déjà précieux — mais prenez la cartographie comme un outil de discussion, pas comme vérité gravée.

Glossaire
agent IASystème d'IA capable de percevoir son environnement, planifier sur plusieurs étapes, utiliser des outils, et agir pour atteindre un objectif.
grounding (ancrage)La capacité d'un système à connecter ses représentations internes à des faits ou des objets du monde réel.
revue narrativeSynthèse de la littérature existante organisée par un auteur selon sa propre grille, sans protocole de sélection formalisé — à distinguer d'une méta-analyse.
La vue d'ensemble

Trois histoires très différentes, mais un fil commun : nous utilisons des systèmes dont nous comprenons encore mal le fonctionnement interne — et ça commence à poser de vraies questions. Le Projet Aletheia soulève une hypothèse troublante : et si les hallucinations n'étaient pas des erreurs d'ignorance, mais des suppressions actives ? ECG-GenoNet nous rappelle qu'on peut construire des outils médicaux à l'air très impressionnant sur des fondations fragiles — de belles performances sur des données synthétiques, ça reste une démonstration de concept, pas un outil clinique. Et la taxonomie des agents IA nous dit que le débat « autonome ou pas » est mal posé depuis le début. Ce que ça dessine collectivement : la recherche avance sur deux fronts simultanément — comprendre ce qui se passe à l'intérieur (interprétabilité, suppression de faits) et déployer des outils à l'extérieur (médecine, agents). Ces deux fronts avancent à des vitesses différentes. C'est là que les risques se nichent.

À surveiller

Côté interprétabilité, surveillez si des équipes établies — Anthropic, DeepMind ou des labos académiques comme le MIT — tentent de répliquer les résultats du Projet Aletheia sur la suppression de faits : c'est la question centrale. Côté médical, la vraie épreuve pour des systèmes comme ECG-GenoNet sera leur passage à des données de patients réels dans des essais prospectifs — on n'en est pas encore là. Et sur les agents, la conférence NeurIPS de décembre sera un bon baromètre de l'état du consensus.

Pour aller plus loin
Merci de m'avoir lu — à demain. — JB
DeepScience — Intelligence scientifique interdisciplinaire
deepsci.io