ML/DL, NLP

ChatGPT : comment ça marche et qu’est-ce que ça change ?

A la question “parle moi de la révolution ChatGPT”, le modèle d’OpenAI répond naïvement : Je suis désolé, mais je ne suis...

Écrit par Ilyes Talbi · 4 min lecture >
Chatgpt prompted by stable diffusion

A la question “parle moi de la révolution ChatGPT”, le modèle d’OpenAI répond naïvement :

Je suis désolé, mais je ne suis pas capable de suivre les événements qui se produisent après ma date de coupe de connaissances. Je suis un modèle de langage à grande échelle entraîné par OpenAI et je suis limité aux connaissances qui m’ont été fournies à la date de coupe de 2021. Je ne suis pas en mesure de naviguer sur Internet ni de mettre à jour mes connaissances, donc je ne suis pas au courant de la révolution ChatGPT dont vous parlez. Je peux toutefois essayer de vous aider avec des questions sur d’autres sujets.

On pourrait croire que le modèle ne connait pas grand chose.

Et pourtant, il sait tellement de choses sur tellement de sujets qu’aucun humain sur terre ne pourra jamais le surpasser.

Il est bon en philo, peut vous donner des conseils de productivité, vous aider sur vos codes (Python, Dart, Go, ce que vous voulez), rédiger vos posts ou vos emails.

Il sait tout faire !

Comment fonctionne ChatGPT ?

Les modèles de langage classiques

Les modèles de langage sont des programmes informatiques conçus pour traiter et générer du texte de manière similaire à un être humain. Ils sont entraînés sur de grandes quantités de données de texte et utilisent ces données pour apprendre à prédire les mots suivants dans une phrase ou un paragraphe.

Il existe différents types de modèles de langage, tels que les modèles de traitement du langage naturel, qui sont conçus pour comprendre et traiter le langage humain dans son ensemble, et les modèles de génération de texte, qui sont conçus pour produire du texte de manière autonome.

Les modèles de langage sont couramment utilisés dans de nombreuses applications, notamment la reconnaissance de la parole, la traduction automatique, la synthèse vocale et la génération de contenu. Ils sont souvent basés sur des réseaux de neurones, une forme de machine learning qui peut apprendre à partir de données et effectuer des tâches sans être explicitement programmé.

Les LLM ou Large Language Models

Les modèles de langage larges (Large Language Models, ou LLM), comme ChatGPT, sont une sous-catégorie de modèles de langage qui sont particulièrement grands et complexes.

Ils sont entraînés sur des corpus de texte très importants, parfois constitués de millions de pages de texte, et utilisent des architectures de réseaux de neurones profonds pour apprendre à traiter le langage.

ChatGPT : le large language model de référence

ChatGPT a été entraîné grâce l’apprentissage par renforcement à partir de feedbacks humains (Reinforcement Learning from Human Feedbacks : RLHF).

Le modèle initial a été construit de manière supervisée et par transfert learning. Des opérateurs humains ont fourni des conversations dans lesquelles ils jouaient les deux rôles, l’utilisateur et le rôle de l’agent.

Les opérateurs avaient accès aux suggestions écrites par le modèle pour les aider à composer leurs réponses. Ce nouveau jeu de données de dialogue a été mixé avec la base de données d’InstructGPT.

Pour créer un modèle de récompense pour la partie apprentissage par renforcement, des données de référence ont été collectées.

Pour collecter ces données, les chercheurs se sont basés sur des conversations que les opérateurs humains avaient avec le chatbot. Un texte écrit par le modèle a été sélectionné au hasard, plusieurs alternatives ont été générées, et les opérateurs humains devaient les classer par ordre de pertinence.

En utilisant ce système de récompense, le modèle est affiné en utilisant l’optimisation PPO (Proximal Policy Optimisation), une technique d’optimisation pour le reinforcment learning proposée récemment par OpenAI.

Le fonctionnement de ChatGPT (source : OpenAI)

Quelles sont les limites de ChatGPT ?

Sur son article de présentation, OpenAI rappelle tout de même quelques unes des limitations possibles de son modèle :

  • ChatGPT peut parfois proposer des réponses correctes du point de vue du langage, mais fausses
  • Une réponse donnée par ChatGPT peut changer radicalement entre 2 appels du même prompt ou avec un changement minime. ChatGPT est très sensible aux variations de l’input
  • Le modèle à tendance à utiliser toujours les mêmes tournures de phrases, et répète souvent les mêmes choses. L’auteur de l’article prend l’exemple du fait qu’il aime bien répéter qu’il s’agit d’un modèle de langage entraîné par OpenAI
  • Le modèle n’est pas capable de poser des questions de clarification lorsque la requête n’est pas claire, il va simplement essayer de deviner
  • Enfin OpenAI, explique que : bien que nous ayons fait des efforts pour que le modèle refuse les demandes inappropriées, il répondra parfois à des instructions nuisibles ou affichera un comportement biaisé. Nous utilisons une API de modération pour avertir ou bloquer certains types de contenu dangereux, mais qui ne sera pas parfait. Nous sommes impatients de recueillir les commentaires des utilisateurs pour nous aider dans nos travaux en cours sur ce système

Qu’est-ce que ChatGPT change ?

Bien que ChatGPT n’est pas encore parfait, il est clair que nous sommes en train de vivre une révolution technologique qui va bouleverser beaucoup de choses du quotidien.

Les applications du modèle sont infinies :

  • Il permet de rédiger du contenu de qualité plus rapidement
  • Il permet de créer des codes simples et va considérablement accélérer le développement d’applications et la recherche
  • Il permettra de créer des scénarios de films, des livres, des instructions de jeux, des musiques, des poèmes, etc.

En tant que prof en école d’ingé, je me suis posé la question de savoir comment détecter les fraudes.

Les DM, les exercices à faire à la maison ou les essais/dissert pour les matières littéraires n’ont presque plus aucune utilité.

C’est ChatGPT qui va tout faire…

Surtout que cette fois-ci, tout le monde est au courant de l’arrivée de ce modèle. Twitter et TikTok l’ont rendu tellement populaire que ça ne sert à rien de le cacher.

Au contraire, en tant que prof de Python et d’algorithmique, j’en ai parlé avec mes étudiants, pour leur montrer la puissance de ce que l’on peut faire avec du Python et de la programmation, et leur redonner goût au sujet.

Conclusion

Pour conclure, j’ai demandé à ChatGPT s’il allait remplacer Google à terme, voici sa réponse :

Il est peu probable que ChatGPT remplace Google ou qu’il soit utilisé de la même manière que Google. ChatGPT est un modèle de langage larges conçu pour traiter et générer du texte de manière similaire à un être humain, tandis que Google est un moteur de recherche qui indexe et fournit des résultats de recherche à partir d’un large éventail de sites Web. Bien que ChatGPT puisse être utilisé dans un certain nombre d’applications, il est principalement destiné à aider les gens à mieux comprendre et à traiter le langage, tandis que Google vise à aider les gens à trouver de l’information sur le Web. En outre, il est peu probable que ChatGPT puisse remplacer Google car il ne dispose pas des capacités de navigation sur le Web ni de la capacité de mettre à jour ses connaissances.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *