Pourra-t-on bientôt lire dans les pensées? Une nouvelle étude décode des images d’activité cérébrale pour en extraire des mots – et du sens

Publié le 12 mai 2023

Un scanner d’IRM, une technique d’imagerie similaire à celle utilisée pour cette étude. Shutterstock

Il est de plus en plus réaliste, d’un point de vue technologique, d’imaginer décoder les pensées des humains. Pour la première fois, des neuroscientifiques ont pu «décoder» des données d’imagerie non invasive des cerveaux de trois participants pour reconstruire des suites de mots et le sens global d’histoires que les participants avaient écouté, regardé ou imaginé.

Christina Maher, University of Sydney

Dans cette nouvelle étude, publiée dans Nature Neuroscience, Alexander Huth et ses collègues, de l’université du Texas, ont réussi à extraire le sens global et ainsi que des phrases, d’images de l’activité du cerveau obtenues par imagerie à résonance magnétique fonctionnelle (ou IRM fonctionnelle).

Décoder le langage

Synthétiser des mots grâce à des signaux cérébraux pourrait être très utiles pour les personnes n’ayant pas accès à la parole à cause de maladies comme les maladies des motoneurones, qui affectent les neurones contrôlant les mouvements volontaires du corps. Ces recherches soulèvent aussi des interrogations sur l’existence de notre vie privée la plus intime, celle de nos pensées.

Les modèles de décodage du langage, ou « décodeurs de la parole », cherchent à utiliser des enregistrements d’activité cérébrale pour en déduire les mots que les sujets entendent, disent ou imaginent.

Jusqu’à présent, les décodeurs de langage avaient seulement été utilisés sur des données obtenues grâce à des dispositifs implantés dans le cerveau, ce qui limitait leur utilité. Et jusqu’ici, les décodeurs utilisant des enregistrements non invasifs de l’activité cérébrale décodaient des mots uniques ou des phrases très brèves, mais n’étaient pas appliqués pour extraire le sens d’un discours continu.

Dans cette nouvelle étude, c’est un signal bien particulier de l’IRM fonctionnelle qui a été exploité : ce signal dépend des flux de sang dans le cerveau et du niveau d’oxygénation du sang.

En se focalisant sur l’activité cérébrale dans les régions du cerveau et dans les réseaux neuronaux qui sont connus pour traiter le langage, les chercheurs ont montré que leur décodeur pouvait être entraîné à reconstruire un discours continu, comprenant des mots spécifiques mais aussi le sens global de phrases plus complètes.

Le décodeur a utilisé les réponses cérébrales de trois participants enregistrées alors que ceux-ci écoutaient des histoires, et il a généré des séquences de mots qui auraient pu produire l’activité cérébrale enregistrée. Ces séquences de mots reproduisaient plutôt bien l’idée générale de l’histoire, et, dans certains cas, incluaient même des mots ou des phrases exacts.

À l’intérieur du scanner d’IRM fonctionelle, les participants ont aussi été amenés à regarder des films muets et à imaginer les histoires correspondantes. Dans les deux cas, le décodeur a été capable de prédire l’essentiel des histoires.

Par exemple, un participant a pensé « Je n’ai pas encoure mon permis de conduire » (I don’t have my driver’s licence yet), et le décodeur a prédit « Elle n’a même pas encore appris à conduire » (She has not even started to learn to drive yet).

De plus, lorsque les participants ont dû écouter activement une histoire en ignorant une seconde histoire diffusée simultanément, le décodeur a seulement pu identifier la première intrigue.

Comment ça marche ?

Tout d’abord, les scientifiques ont demandé aux participants de passer 16 heures dans un scanner IRM fonctionnelle, où ils ont écouté des histoires lues pendant que leurs activités cérébrales étaient enregistrées.

Ces réponses cérébrales ont servi à entraîner un « encodeur », c’est-à-dire un modèle informatique qui prédit comment le cerveau réagit aux mots entendus par le participant. Après cet entraînement, l’encodeur peut prédire avec une bonne précision ce que le cerveau de chaque participant répondrait à l’écoute d’une suite de mots particuliers.

Mais aller dans l’autre direction, c’est-à-dire extraire une suite de mots à partir de l’activité cérébrale, est bien plus difficile.

En effet, le modèle d’encodeur est conçu pour relier des activités cérébrales et des « éléments sémantiques » ou le sens global de mots ou de phrases. Pour y parvenir, le système utilise le modèle de langage « GPT », pour generative pre-trained transformer, le précurseur du GPT-4 actuel. Le décodeur génère ensuite la suite de mots qui aurait pu produire la réponse cérébrale observée.

The decoder could also describe the action when participants watched silent movies. Tang et al./Nature Neuroscience

La justesse de chaque prédiction du décodeur est vérifiée en l’utilisant pour calculer l’activité cérébrale correspondante. On compare ensuite cette activité cérébrale prédite par le décodeur à celle qui a été réellement enregistrée.

Pendant ce processus, très gourmand en ressources de calcul, de nombreuses prédictions sont générées une par une, et elles sont classées en fonction de leurs justesses : les prédictions peu adéquates sont éliminées, les plus précises sont conservées. Puis, le mot suivant dans la séquence est prédit, jusqu’à ce que la séquence la plus juste soit déterminée.

Des mots et du sens

La nouvelle étude montre que, pour mener à bien le processus de prédiction, des données provenant de multiples régions du cerveau étaient nécessaires. Ces régions sont diverses mais très spécifiques : il s’agit du réseau prenant en charge la parole, de la région d’association pariétale/temporale/occipitale et du cortex préfrontal.

Une différence majeure entre ce travail et les études précédentes est le type de données utilisées. En effet, la plupart des décodeurs relient des données provenant de régions cérébrales impliquées dans la dernière étape de la formation de la parole, à savoir les mouvements de la bouche et de la langue. Ce décodeur-ci travaille à un autre niveau, sur les idées et la signification des pensées.

Une des limitations des données d’IRM fonctionnelle est leur faible « résolution temporelle ». En effet, le signal d’oxygénation du sang croît et décroît en environ 10 secondes, une période pendant laquelle nous entendons une vingtaine de mots ou plus. Par conséquent, cette technique ne détecte pas de mots individuels mais la signification probable de suites de mots.

On ne panique pas (pas encore)

L’idée que l’on puisse lire dans les pensées soulève naturellement des inquiétudes quant à l’existence de notre vie privée la plus intime, ce qui se passe dans nos têtes. Les chercheurs ont réalisé des expériences additionnelles pour clarifier les capacités de la technique.

Ces expériences montrent qu’il n’y a pas encore à s’inquiéter de ce que nos pensées puissent être lues quand on marche dans la rue, ou si l’on est pas prêt à coopérer.

En effet, un décodeur entraîné sur les données cérébrales d’une personne prédit mal les éléments sémantiques à partir des données cérébrales d’une autre personne. De plus, les participants peuvent compliquer la tâche de décodage en tournant leur attention vers une autre tâche, par exemple nommer des animaux ou raconter une autre histoire.

Le décodeur fonctionne également mal si les participants bougent dans le scanner d’IRM fonctionnelle, car c’est une technique d’imagerie très sensible aux mouvements. La coopération des participants est ici indispensable.

Avec ces contraintes techniques, qui s’ajoutent au besoin d’ordinateurs très puissants pour faire tourner le décodeur, il est très improbable à ce stade que l’on puisse à ce stade décoder les pensées de quelqu’un contre son gré.

Enfin, le décodeur ne marche pour l’instant qu’avec des données obtenues par IRM fonctionnelle, qui est une technique coûteuse et souvent délicate à mettre en œuvre. Le groupe de recherche a l’intention de tester cette méthode avec des données issues d’autres technologies non invasives d’imagerie cérébrale.

Christina Maher, Biomedical Engineer and Neuroscientist, University of Sydney

Cet article est republié à partir de The Conversation sous licence Creative Commons. Lire l’article original.

S’abonner

0 Commentaires

Le plus ancien

Le plus récent Le plus populaire

Commentaires en ligne

Afficher tous les commentaires

Les non-dits du monde multipolaire

Le nouveau contexte mondial en pleine reconfiguration se situe non seulement dans un espace à comprendre, mais aussi dans un temps particulier à reconnaître.

Igor Balanovski

Sciences & TechnologiesAccès libre

Timides, audacieux, anxieux… les poissons, aussi, ont une personnalité

Si vous pensiez que ce qui ressemble le plus à un bar est un autre bar, détrompez-vous, chaque individu a sa propre personnalité, et la recherche décortique ces traits pour mieux les comprendre et pour améliorer le bien-être des animaux.

Bon pour la tête

Sciences & TechnologiesAccès libre

Les réseaux technologiques autoritaires

Une équipe de chercheurs met en lumière l’émergence d’un réseau technologique autoritaire dominé par des entreprises américaines comme Palantir. À travers une carte interactive, ils dévoilent les liens économiques et politiques qui menacent la souveraineté numérique de l’Europe.

Markus Reuter

Santé

L’histoire des épidémies reste entourée de mystères et de fantasmes

Les virus n’ont pas attendu la modernité pour bouleverser les sociétés humaines. Dans un livre récent, les professeurs Didier Raoult et Michel Drancourt démontrent comment la paléomicrobiologie éclaire d’un jour nouveau l’histoire des grandes épidémies. De la peste à la grippe, du coronavirus à la lèpre, leurs recherches révèlent combien (...)

Martin Bernard

Sciences & TechnologiesAccès libre

Superintelligence américaine contre intelligence pratique chinoise

Alors que les États-Unis investissent des centaines de milliards dans une hypothétique superintelligence, la Chine avance pas à pas avec des applications concrètes et bon marché. Deux stratégies opposées qui pourraient décider de la domination mondiale dans l’intelligence artificielle.

Politique

L’identité numérique, miracle ou mirage?

Le 28 septembre, les Suisses se prononceront à nouveau sur l’identité numérique (e-ID). Cette fois, le Conseil fédéral revient avec une version révisée, baptisée «swiyu», présentée comme une solution étatique garantissant la souveraineté des données. Mais ce projet, déjà bien avancé, suscite des inquiétudes quant à son coût, sa gestion, (...)

Anne Voeffray

Sciences & Technologies

Les délires d’Apertus

Cocorico! On aimerait se joindre aux clameurs admiratives qui ont accueilli le système d’intelligence artificielle des hautes écoles fédérales, à la barbe des géants américains et chinois. Mais voilà, ce site ouvert au public il y a peu est catastrophique. Chacun peut le tester. Vous vous amuserez beaucoup. Ou alors (...)

Jacques Pilet

Culture

Quand notre culture revendique le «populaire de qualité»

Du club FipFop aux mémorables albums à vignettes des firmes chocolatières NPCK, ou à ceux des éditions Silva, en passant par les pages culturelles des hebdos de la grande distribution, une forme de culture assez typiquement suisse a marqué la deuxième décennie du XXe siècle et jusque dans la relance (...)

Jean-Louis Kuffer

Culture

Du réconfort qu’apportent les grenouilles

Face à la morosité de l’actualité, les grenouilles empaillées d’Estavayer-le-Lac représentant des scènes du quotidien offrent un peu d’autodérision. Car ne sommes-nous pas tous des petits êtres qui croassent et gobent les mouches?

Jacques Pilet

Sciences & Technologies

Intelligence artificielle: les non-dits

On nous annonce une révolution avec l’arrivée invasive et fulgurante de l’IA dans nos vies, nos modes d’apprentissage et de production et, surtout, la mise à disposition de l’information immédiate et «gratuite» sans effort, objet central ici. Or nous ne mesurons aucunement ce que cela signifie vraiment.

Jamal Reddani

Sciences & TechnologiesAccès libre

Combien de temps l’humanité survivrait-elle si l’on arrêtait de faire des enfants?

Suffit-il de calculer l’espérance de vie maximale d’un humain pour deviner combien de temps mettrait l’humanité à disparaître si l’on arrêtait de se reproduire? Pas si simple répond l’anthropologue américain Michael A. Little.

Bon pour la tête

Sciences & Technologies

Masculin et féminin: on n’en a pas fini avec les stupidités

C’est le spermatozoïde le plus rapide, le plus fort et le plus malin qui féconde l’ovule, essaie-t-on de nous faire croire. Ainsi, certaines positions sexuelles favoriseraient les mâles rapides, d’autres les femelles résistantes. C’est bien sûr beaucoup plus subtil que ça, plus intelligent. La vie n’est pas une course.

Patrick Morier-Genoud

Culture

Faut-il vraiment se méfier de Yuval Noah Harari?

La trajectoire du petit prof d’histoire israélien devenu mondialement connu avec quatre ouvrages de vulgarisation à large spectre, dont Sapiens aux millions de lecteurs, a suscité quelques accusations portant sur le manque de sérieux scientifique de l’auteur, lequel n’a pourtant jamais posé au savant. D’aucun(e)s vont jusqu’à le taxer de (...)

Jean-Louis Kuffer

SantéAccès libre

TikTok et la santé mentale des adolescents: les alertes de la recherche

TikTok est l’un des réseaux sociaux les plus populaires chez les adolescents. Selon des études de chercheurs, la plateforme reconfigure leurs repères attentionnels, affectifs et cognitifs, avec un impact important sur leur santé mentale et leur construction personnelle.

Bon pour la tête

Sciences & Technologies

Ces bactéries qui survivent dans l’espace

Une équipe de chercheurs chinois a détecté un micro-organisme d’une nouvelle espèce sur les surfaces internes du matériel de la station spatiale Tiangong, expliquent nos confrères de «L’Espresso». Il s’agit d’une bactérie qui résiste à la microgravité et aux radiations spatiales.

Simon Murat

Culture

Quand Giuliano Da Empoli s’en prend aux nouveaux prédateurs

A l’inquiétude croissante et confuse qui prévaut aujourd’hui, l’essayiste, en homme de grande expérience «sur le terrain», observateur lucide nourri d’Histoire et dont le présent récit foisonne d’anecdotes significatives, oppose sa lucidité d’esprit libre en nous promenant du siège new yorkais de l’ONU aux coulisses machiavéliennes de Riyad ou Washington, (...)

Jean-Louis Kuffer

Pourra-t-on bientôt lire dans les pensées? Une nouvelle étude décode des images d’activité cérébrale pour en extraire des mots – et du sens

Décoder le langage

Comment ça marche ?

The decoder could also describe the action when participants watched silent movies. Tang et al./Nature Neuroscience

Des mots et du sens

On ne panique pas (pas encore)

Christina Maher, Biomedical Engineer and Neuroscientist, University of Sydney

Cet article est republié à partir de The Conversation sous licence Creative Commons. Lire l’article original.

Les non-dits du monde multipolaire

Timides, audacieux, anxieux… les poissons, aussi, ont une personnalité

Les réseaux technologiques autoritaires

L’histoire des épidémies reste entourée de mystères et de fantasmes

Superintelligence américaine contre intelligence pratique chinoise

L’identité numérique, miracle ou mirage?

Les délires d’Apertus

Quand notre culture revendique le «populaire de qualité»

Du réconfort qu’apportent les grenouilles

Intelligence artificielle: les non-dits

Combien de temps l’humanité survivrait-elle si l’on arrêtait de faire des enfants?

Masculin et féminin: on n’en a pas fini avec les stupidités

Faut-il vraiment se méfier de Yuval Noah Harari?

TikTok et la santé mentale des adolescents: les alertes de la recherche

Ces bactéries qui survivent dans l’espace

Quand Giuliano Da Empoli s’en prend aux nouveaux prédateurs

Aide

Antithèse

Nous trouver