Paris, le 24 janvier 2023
Depuis novembre dernier, les internautes peuvent s’entretenir avec le robot conversationnel ChatGPT, développé par l’entreprise californienne OpenAI, ou lui demander de produire un texte en piochant des éléments dans une base de données constituée de milliards de pages web existantes. Comment ChatGPT fonctionne-t-il ? Avec quels résultats ? Quelles questions son usage soulève-t-il ? Le décryptage de l’Académie des sciences.
"Un chatbot, ou agent conversationnel", explique Patrick Flandrin, directeur de recherche CNRS à l’École normale supérieure de Lyon, président de l’Académie des sciences en 2021-2022 "est un logiciel capable, via une interface, de simuler une conversation humaine. Autrement dit, c’est un programme dont l’ambition est de passer le test de Turing". Ce dernier a été proposé par le mathématicien Alan Turing en 1950, pour tester l’intelligence artificielle. Il consiste à confronter un évaluateur humain, à l’aveugle, à un autre humain et à un ordinateur. Si l’évaluateur échoue à distinguer l’homme de la machine en dialoguant via un jeu de questions-réponses avec chacun d’eux, la machine a passé le test avec succès.
ChatGPT repose sur une intelligence artificielle baptisée GPT3 (Generative Pre-trained Transformer de 3e génération), "capable de produire du langage naturel complexe", précise Patrick Flandrin. Il utilise des algorithmes d’apprentissage automatique qui analysent des textes pour générer, à partir de ce corpus et des informations précédemment apprises, les réponses aux questions qu’on lui pose.
Machine learning
"ChatGPT apprend à la fois par apprentissage automatique supervisé et par apprentissage par renforcement", explique Patrick Flandrin. Dans le cadre de l’apprentissage supervisé, la machine apprend à effectuer une tâche donnée en étudiant des exemples issus d’une base constituée à cette fin par l’humain. "C’est ce type d’apprentissage qu’utilisent les traducteurs automatiques, pour qui les traductions existantes sont autant de pierres de Rosette". Dans le cas de ChatGPT, la base de données est constituée de millions de pages web et permet à la machine de comprendre comment est construit le langage.
L’apprentissage par renforcement, comme l’apprentissage humain et animal, est quant à lui basé sur l’expérimentation et la récompense. Lorsqu’une expérience amène un résultat positif et permet d’obtenir une récompense, elle est considérée comme positive et devant être réitérée. Inversement, si le résultat de l’expérience n’est pas concluant, on le mémorise pour ne plus faire la même erreur. Ici, "l’algorithme explore le champ des possibles et apprend à choisir la solution qui offre la plus grande récompense, en proposant par exemple le mot le plus probable pour compléter une phrase dont les premiers mots sont donnés".
Un changement de paradigme
Et ça marche ! "Les résultats sont souvent impressionnants", confesse Patrick Flandrin. "ChatGPT apprend de ses erreurs et tient compte, dans ses retours, du contexte, des réponses qu’il a fournies précédemment et des réactions qu’elles ont suscitées". Il est capable de produire des textes cohérents à partir d’une consigne d’écriture, de résumer un article, de générer automatiquement des courriels. ChatGPT peut également être interfacé avec un moteur de recherche existant. C’est d’ailleurs ce que souhaite faire Microsoft avec Bing. "Les moteurs de recherche comme Google indiquent pour l’instant où trouver la réponse à n’importe quelle question ou presque en facilitant l’accès à des milliards de pages et autant de sources. Là, un pas est clairement franchi.", souligne Patrick Flandrin. "ChatGPT peut fournir directement une réponse structurée et rédigée à la question posée".
Les potentialités de ce type d’outils sont gigantesques. Les questions soulevées nombreuses.
Premier écueil, "la qualité des textes produits ou la fluidité des conversations avec ChatGPT ont tendance à nous faire croire que l’information donnée -autrement dit le fond- est forcément juste". Ensuite, "les phases d’apprentissage reflètent implicitement une certaine vision du monde. Celle que portent les données utilisées et l’usage qui en est permis par ceux qui développent et perfectionnent le chatbot". Autrement dit, "on apprend par rapport à ce qui fait consensus". Quid alors de la disruption, de la création, de la découverte ? D’autres questions vont aussi se poser, comme celles de la mention des sources, de la propriété intellectuelle... Sans parler des coûts et des impacts environnementaux de l’usage de tels systèmes d’intelligence artificielle qui sont très énergivores à grande échelle.
Rédaction Hélène Perrin