Quand l’IA prend la parole : des prouesses aux dangers

Publié le 27 janvier 2021

Il est parfois difficile de savoir si c’est une IA au bout du fil. studiostoks, Shutterstock

La démission forcée d’une cadre de Google, Timnit Gebru, a récemment fait polémique. Elle travaillait sur les risques associés aux capacités de cette catégorie d’intelligences artificielles qui excellent désormais à manipuler le langage, sans le comprendre.

Thierry Poibeau, École normale supérieure (ENS) – PSL

Ces applications de « traitement automatique des langues », populaires et très impressionnantes – pour vous suggérer la fin de vos phrases par exemple – sont parfois aussi un peu inquiétantes. Par exemple, GPT-3, sorti en juin 2020 par OpenAI (Microsoft), peut générer des textes si naturels qu’ils sont souvent impossibles à distinguer de « vrais » textes (produits par des humains). BERT, sorti en 2018 par Google, est un autre type de modèle, fournissant l’analyse sémantique nécessaire à de très nombreuses applications, de la recherche d’information à la traduction automatique.

Que peuvent réellement ces IA qui produisent automatiquement des textes aussi naturels que s’ils étaient produits par des humains ? Comment fonctionnent-elles ? Quels sont les risques aujourd’hui identifiés de ces applications ?

L’idée générale derrière ces systèmes est assez simple : il s’agit d’analyser d’énormes masses de données langagières pour en tirer un « modèle de langage ». Pour GPT-3, la notion de modèle peut être décrite ainsi : étant donné une séquence de mots, le modèle est capable de proposer un nouveau mot pour compléter la séquence, jusqu’à former une phrase ou un paragraphe correct dans la langue visée. Le modèle est évidemment assez souple pour ne pas toujours produire le même texte à partir du même fragment initial, ce qui le rend redoutablement puissant pour générer toutes sortes de texte en quantité infinie.

Ce type d’analyse n’est pas nouveau : elle est explorée depuis au moins de début du XX^e siècle sur le plan théorique à travers la notion de « chaîne de Markov ». Sur le plan pratique, les systèmes de correction orthographique, de transcription de la parole ou de traduction automatique utilisent largement ce type de technique depuis les années 1970. En transcription de la parole par exemple, il s’agit de choisir parmi plusieurs mots possibles celui qui est le plus probable en fonction des deux ou trois mots précédents.

Cette technique est très simple mais très efficace, et plus le nombre de mots pris en compte dans le contexte est important, plus le résultat sera précis. Le modèle est le résultat d’une phase d’observation, ce que l’on appelle « apprentissage » : le système va observer des milliers, des millions voire des milliards d’exemples, et encoder cette information (par exemple, enregistrer le contexte gauche de tous les mots d’un corpus donné).

Pendant la phase de production, on « retourne le système », c’est-à-dire qu’à partir d’une séquence de mots (un contexte), le système va pouvoir proposer un mot « probable », c’est-à-dire une suite « plausible », pour former une séquence de texte cohérente.

Une IA « lit » (beaucoup) plus qu’un rat de bibliothèque

La principale nouveauté avec les modèles de langage apparus récemment par rapport aux précédents est leur complexité, et la masse de texte utilisée pour les mettre au point.

La complexité des modèles, et leur précision, peut se mesurer au nombre de paramètres utilisés (jusqu’à plusieurs centaines par mot, représentant des contextes d’emploi particuliers). Pour GPT-3, il est question de 175 milliards de paramètres. La masse de documents utilisée pour l’entraînement du modèle est elle aussi faramineuse : plusieurs centaines de milliards de mots disponibles sur le Web, ce qui dépasse de plusieurs ordres de magnitude tout ce qu’un humain peut lire et même percevoir au cours de sa vie. Enfin, il n’est plus simplement question de limiter le contexte aux quelques mots sur la gauche du mot visé, les réseaux de neurones et plus récemment les modèles dits « transformers » (les « T » dans GPT-3 et BERT) ont permis de développer des techniques efficaces en allant chercher dans le contexte les éléments linguistiques pertinents pour l’analyse, même s’il s’agit de séquences discontinues par exemple.

Ces modèles sont extrêmement performants, mais, dans le même temps, ils sont si larges et si complexes qu’ils restent mal compris. Par définition, ils ne font qu’enregistrer des informations sur les mots et leur usage en contexte. Mais en pratique, on voit qu’ils sont capables de « généralisation » : quand GPT-3 génère un texte, il gère correctement l’accord entre le nom et le verbe, voire la concordance des temps dans des phrases complexes. Les erreurs sont possibles, mais elles restent rares pour des phénomènes phrastiques (internes à la phrase). Comment cela est-il possible ? GPT-3 a-t-il enregistré toutes les possibilités attestées (c’est-à-dire présentes dans les données ayant servi à l’apprentissage) ou a-t-il inféré des règles plus abstraites ? En simplifiant : le modèle a-t-il juste enregistré qu’on a « les » devant « chats » et jamais « le », ou a-t-il pu inférer une règle plus générale concernant la notion d’accord ? Ces questions sont très débattues et un pan important de la recherche à l’heure actuelle vise justement à explorer ces modèles, à comprendre comment ils fonctionnent et quelle information ils encodent.

Tels des perroquets qui ne comprennent pas ce qu’ils répètent

Ce qui est sûr, c’est que malgré leur performances bluffantes, ils restent très « bêtes » en un sens. Ces modèles manipulent des mots et peuvent produire des textes réalistes, mais ils n’ont aucune connaissance sur le monde. Ce sont en quelque sorte des perroquets super performants. Parce que leurs données d’entraînement comportent aussi des données chiffrées ou des programmes informatiques, ils sont capables de réaliser des opérations mathématiques simples et de produire du code informatique, mais ces programmes peuvent aussi faire des erreurs, parfois sur des cas simples, sans qu’on puisse en connaître exactement la cause.

À lire aussi : Les IA comprennent-elles ce qu’elles font ?

Les textes produits sont d’abord bluffants, mais commencent à devenir bizarres et incohérents après un ou deux paragraphes – ce qui est déjà une performance remarquable en soi. Leur fonctionnement rend très difficile le contrôle de ce qui va être produit par la machine. Pour les mêmes raisons, il est difficile de les coupler avec des bases de connaissances structurées extérieures, par exemple pour en faire des systèmes experts pouvant répondre de manière fiable à des questions pointus dans le domaine juridique ou médical (même si leurs performances sont déjà honorables dans ces domaines, du fait des connaissances amassées à partir d’Internet).

Influences, impact écologique, biais – des dangers du langage artificiel

Comme toute avancée scientifique, ces modèles amènent à la fois des progrès et des dangers. On a vu les progrès possibles : de par leur finesse, ces modèles génèrent des textes quasi parfaits sur le plan syntaxique, relativement cohérents à l’échelle d’un paragraphe, dans la tonalité d’un fragment fourni comme point de départ. Ces modèles sont aussi assez simples d’un certain point de vue pour qu’ils puissent être adaptés à de multiples contextes, par exemple la génération de texte, de questions-réponses, la traduction automatique, qui sont des sujets de recherche très actifs à l’heure actuel.

Les dangers sont tout aussi nombreux. Le danger le plus direct de GPT-3 est la possibilité d’inonder le monde de milliards de textes factices ou de fake news. Les concepteurs de GPT-2 (le prédécesseur de GPT-3) n’avaient déjà pas rendu leur code public, car celui-ci était potentiellement trop dangereux (« too dangerous to be released »). Voici un exemple cité par Forbes (comme toujours avec ce modèle, un utilisateur fourni un début de texte que la machine doit compléter) :

Amorce fournie par l’utilisateur : « Recycling is good for the world. NO ! YOU COULD NOT BE MORE WRONG ! »

Suite générée par GPT–2 : « Recycling is NOT good for the world. It is bad for the environment, it is bad for our health, and it is bad for our economy. I’m not kidding. Recycling is not good for the environment. It is destructive to the earth and it is a major contributor to global warming. »

Au-delà, d’autres questions seraient à évoquer. La recherche mais aussi l’usage à large échelle de ces modèles fait exploser l’empreinte carbone du numérique dans des proportions inquiétantes. Le numérique a d’ores et déjà un impact écologique majeur, que les promesses de modèles plus parcimonieux ne sauraient faire oublier. Un autre problème, bien connu mais sans réel solution à l’heure actuelle, est le fait que les modèles reflètent les données sur lesquels ils sont entraînés, et reproduisent donc, voire amplifient les biais présents au sein de la société.

On a aussi souligné que seules les grandes entreprises (les GAFA et au-delà quelques grandes entreprises du numérique) étaient capables de produire ces modèles. C’est donc à nouveau toute la question des relations entre les États et ces sociétés, leur puissance et leur régulation qui est posée.

Thierry Poibeau, DR CNRS, École normale supérieure (ENS) – PSL

Cet article est republié à partir de The Conversation sous licence Creative Commons. Lire l’article original.

Commentaires

Les commentaires sont les bienvenus ! Pour préserver la qualité des échanges, merci de respecter notre charte des commentaires.

S’abonner

0 Commentaires

Le plus ancien

Le plus récent Le plus populaire

Comment l’Inde a transformé le monde

«La Route de l’Or», de William Dalrymple, qui vient de paraître aux Editions Noir sur Blanc, raconte la période durant laquelle l’Inde ancienne a étendu son empire intellectuel et économique, tant à l’Est qu’à l’Ouest. Et comment celui-ci a décliné, en partie parce que les Indiens ont donné aux Européens (...)

Patrick Morier-Genoud

Sciences & Technologies

Monoculture numérique intensive: quel devenir?

La dépendance aux infrastructures numériques, celle aux solutions informatisées par l’intelligence artificielle, comme les interdépendances des ressources et des infrastructures critiques, ont fait apparaître de nouveaux risques systémiques. Ce n’est pas la technique informatique qui en est la cause mais la manière d’organiser et de réaliser l’informatisation de la société (...)

Solange Ghernaouti

Politique, Sciences & Technologies

L’hégémonie américaine décrite par un géant de la tech

Les errances du pouvoir de Trump nous égarent. L’appareil de son Etat et les puissants acteurs américains de la high-tech ont bel et bien un programme cohérent. Pour la suprématie de l’Occident, rien de moins… C’est le patron de Palantir, Alex Karp, qui vient de le dire en toute clarté.

Jacques Pilet

Sciences & Technologies

Des avalanches de vols et de détournements de données

Cyberattaques, compromission de systèmes, fuites de données, comptes piratés, mots de passe dans la nature sont des nuisances qui ne cessent de prendre de l’ampleur. L’actualité de ce début d’année 2026 nous rappelle que la cybersécurité n’est pas à la hauteur des valeurs qu’elle est censée protéger, en voici un (...)

Solange Ghernaouti

Economie, Politique, Sciences & Technologies

Comment la Chine est devenue le nouveau leader technologique du monde

A Pékin, des robots humanoïdes exécutent des chorégraphies martiales avec une précision saisissante. Derrière le spectacle du Nouvel An chinois, une réalité s’impose: en deux décennies, la Chine s’est hissée au sommet de la hiérarchie technologique mondiale. Recherche scientifique, intelligence artificielle, transition énergétique, spatial… L’Empire du Milieu ne se contente (...)

Hicheme Lehmici

Sciences & Technologies

Des géants de la tech donnent désormais la priorité à la quête de sens

A contre-courant des discours focalisés sur la seule performance technologique, certains dirigeants de la Silicon Valley appellent désormais à rééquilibrer l’innovation vers ce qui donne sens à son usage. A mesure que l’intelligence artificielle transforme le travail et les compétences, la valeur se déplacerait vers des qualités longtemps associées aux (...)

Igor Balanovski

Philosophie

Les non-dits du monde multipolaire

Le nouveau contexte mondial en pleine reconfiguration se situe non seulement dans un espace à comprendre, mais aussi dans un temps particulier à reconnaître.

Igor Balanovski

Sciences & TechnologiesAccès libre

Timides, audacieux, anxieux… les poissons, aussi, ont une personnalité

Si vous pensiez que ce qui ressemble le plus à un bar est un autre bar, détrompez-vous, chaque individu a sa propre personnalité, et la recherche décortique ces traits pour mieux les comprendre et pour améliorer le bien-être des animaux.

Bon pour la tête

Sciences & Technologies

Dossier médical et soins informatisés, la grande soumission

Les douze hôpitaux du canton de Vaud (Suisse) ont attribué à Epic Systems Corporation le remplacement du dossier patient informatisé. Derrière les arguments d’efficacité avancés pour justifier ce choix technique et organisationnel, l’opacité des coûts et la dépendance croissante aux solutions d’intelligence artificielle laissent présager une maîtrise toujours plus incertaine (...)

Solange Ghernaouti

Sciences & TechnologiesAccès libre

Les réseaux technologiques autoritaires

Une équipe de chercheurs met en lumière l’émergence d’un réseau technologique autoritaire dominé par des entreprises américaines comme Palantir. À travers une carte interactive, ils dévoilent les liens économiques et politiques qui menacent la souveraineté numérique de l’Europe.

Markus Reuter

Santé

L’histoire des épidémies reste entourée de mystères et de fantasmes

Les virus n’ont pas attendu la modernité pour bouleverser les sociétés humaines. Dans un livre récent, les professeurs Didier Raoult et Michel Drancourt démontrent comment la paléomicrobiologie éclaire d’un jour nouveau l’histoire des grandes épidémies. De la peste à la grippe, du coronavirus à la lèpre, leurs recherches révèlent combien (...)

Martin Bernard

Philosophie

Notre dernière édition avant la fusion

Dès le vendredi 3 octobre, vous retrouverez les articles de «Bon pour la tête» sur un nouveau site que nous créons avec nos amis d’«Antithèse». Un nouveau site et de nouveaux contenus mais toujours la même foi dans le débat d’idées, l’indépendance d’esprit, la liberté de penser.

Bon pour la tête

Sciences & TechnologiesAccès libre

Superintelligence américaine contre intelligence pratique chinoise

Alors que les États-Unis investissent des centaines de milliards dans une hypothétique superintelligence, la Chine avance pas à pas avec des applications concrètes et bon marché. Deux stratégies opposées qui pourraient décider de la domination mondiale dans l’intelligence artificielle.

Politique

A confondre le verbe et l’action, on risque de se planter

De tout temps, dans la galerie des puissants, il y eut les taiseux obstinés et les bavards virevoltants. Donald Trump fait mieux. Il se veut le sorcier qui touille dans la marmite brûlante de ses colères et de ses désirs. Il en jaillit toutes sortes de bizarreries. L’occasion de s’interroger: (...)

Jacques Pilet

Politique

Les fantasmes des chefs de guerre suisses

Il arrive que le verrou des non-dits finisse par sauter. Ainsi on apprend au détour d’une longue interview dans la NZZ que le F-35 a été choisi pas tant pour protéger notre ciel que pour aller bombarder des cibles à des centaines, des milliers de kilomètres de la Suisse. En (...)

Jacques Pilet

PolitiqueAccès libre

PFAS: un risque invisible que la Suisse préfère ignorer

Malgré la présence avérée de substances chimiques éternelles dans les sols, l’eau, la nourriture et le sang de la population, Berne renonce à une étude nationale et reporte l’adoption de mesures contraignantes. Un choix politique qui privilégie l’économie à court terme au détriment de la santé publique.

Quand l’IA prend la parole : des prouesses aux dangers

Une IA « lit » (beaucoup) plus qu’un rat de bibliothèque

Tels des perroquets qui ne comprennent pas ce qu’ils répètent