au sommaire
Le 14 mars 2023, OpenAI a annoncé la sortie de GPT-4, un nouveau modèle d'intelligence artificielle (IAIA) pour ChatGPTChatGPT. Quelles sont donc les caractéristiques de GPT-4 ?
Le grand public connaît ChatGPT comme un chatbot ou interface de conversation intelligente. Qu'en est-il dans la pratique ? Lorsque vous posez votre question à ChatGPT, celui-ci délègue la tâche d'analyse de votre requête et l'élaboration d'une réponse à un modèle de langage - on parle aussi de LLM (Large Langage Model ou Modèle de langage étendu).
C'est le modèle de langage qui va faire toute la différence dans le traitement de votre question. Voici quelques exemples de tels modèles LLM :
GPT-3.5 | Utilisé par la version gratuite de ChatGPT |
GPT-4 | Proposé avec la version payante ChatGPT Plus |
LaMDA | Le modèle mis à contribution par GoogleGoogle Bard |
BERT | Un autre modèle développé par Google |
LLaMA | Développé par Meta pour son chatbot Blenderbot |
BloomBloom | Un modèle open source prometteur créé sous la supervision de HuggingFace |
Gopher | Un LLM développé par DeepMind, une filiale de Google |
Qu'est-ce qui distingue un modèle de langage ?
C'est la puissance d'un modèle IA de langage LLM qui va faire toute la différence dans l'efficacité d'un chatbot tel que ChatGPT. Les critères par lesquels on peut évaluer un tel modèle sont nombreux. En voici quelques-uns :
Le nombre de paramètres sur lequel il a été entraîné
Chaque modèle existant a été entraîné sur un certain nombre de paramètres. Plus ce nombre est important et plus le modèle a des chances d'être fiable. Quelques exemples :
- LLaMA a été entraîné - selon ses versions - sur un volumevolume allant de 7 à 65 milliards de paramètres ;
- GPT-3 a été entraîné sur 175 milliards de paramètres ;
- Bloom a été entraîné sur 176 milliards de paramètres ;
- Gopher a été entraîné sur 280 milliards ;
- GPT-3.5 sur 355 milliards de paramètres.
Le volume de texte pris en compte
La quantité de texte qu'un LLM peut traiter va également influer sur ses performances. À titre d'exemple, lorsque nous lui demandons de résumer un texte, par exemple celui d'une page Web, GPT-3.5 ne peut prendre en compte qu'environ 3 000 mots.
En réalité, en IA on parle plutôt de « token » comme unité analysée, soit quatre caractères. Dans le cas présent, les 3 000 mots correspondent à 4 096 tokens. Si le texte contient davantage de caractères, le chatbot se déclare incapable d'effectuer la tâche.
Le nombre de mots précédents pris en compte
Un modèle de langage fonctionne selon un critère précis : en analysant les mots qui précèdent dans un texte, il tente de prédire quel est le mot qui a le plus de chance d'être le suivant. Cela peut sembler étrange, mais prenons un exemple ultra-simple pour mieux illustrer cette logique. Si vous voyez comme suite de mots « Christophe Colomb a découvert l'Amérique en », un seul terme vous vient à l'esprit pour la compléter : « 1492 ». Un LLM fonctionne sur ce même principe et à très grande échelle. Ainsi, GPT 3.5 peut prendre en compte les 3 000 mots précédents.
Les éléments qui peuvent être inclus dans une requête
La plupart des modèles ne peuvent accepter que du texte en entrée. Certains peuvent lire le contenu de pages Web, de fichiers PDF. Lors de la conférence de lancement organisée le 14 mars, GPT-4 a été annoncé comme ayant la capacité de pouvoir analyser des images.
Les caractéristiques de GPT-4
ChatGPT Plus, la version payante de ChatGPT, peut s'appuyer sur trois modèles d'IA : deux versions de GPT 3.5 et GPT-4.
Ces critères ayant été posés, nous pouvons mieux évaluer ce qui distingue GPT-4 d'autres modèles, notamment GPT-3.5.
| GPT-4 | GPT-3.5 |
Nombre de paramètres sur lequel il a été entraîné | 100 000 milliards | 175 milliards |
Volume de texte pris en compte | 25 000 | 3 000 |
Combien de mots précédents il peut analyser | Environ 6 000 (8 192 tokens ou unités de 4 caractères). Il est censé pouvoir monter jusqu'à 32 768 tokens. | Environ 3 000 (4 096 tokens ) |
Nombre de langues supportées | 26 | 25 |
Peut accepter des images en entrée | Oui | Non |
Peut analyser des fichiers PDF | Oui | Non |
Comme on peut le voir, la progression est majeure sur de nombreux critères. Et cet accroissement de puissance est vérifiable sur la majorité des requêtes : GPT-4 amène ChatGPT à produire des réponses plus exactes (même s'il lui arrive encore de se tromper), plus détaillées, généralement mieux formulées. Et il fait preuve d'une logique plus poussée.
GPT-4 testé par OpenAI
OpenAI a testé les capacités de GPT-4 sur plusieurs examens américains majeurs. Il a obtenu plusieurs résultats de haut niveau.
Parmi les prouesses accomplies figurent les suivantes :
- un score de 5/5 sur l'examen de biologie AP Biology ;
- un score de 298/400 à l'examen UBE du barreau américain, le plaçant dans le Top 10 % des étudiants ;
- la note 700/800 au SAT de mathématiques et 710/800 au SAT de lecture et d'écriture, le SAT étant l'examen d'entrée à l'université ;
- 88 % de bonnes réponses au LSAT, test d'admission à la faculté de droit.
Comment accéder à GPT-4 ?
Lorsque vous êtes sur ChatGPT, repérez la mention « Upgrade to Plus » dans la colonne de gauche et cliquez dessus. Vous êtes transféré vers un écran vous proposant de vous abonner à raison de 20 dollars par mois (plus 4 $ de TVA). Si vous souscrivez à un tel abonnement, vous pouvez alors accéder à ChatGPT Plus et exploiter les performances de GPT-4.