OpenAI a annoncé la sortie de la dernière version de son grand modèle de langage, GPT-4. Ce qui, selon la société, présente des «performances de niveau humain» lors de divers tests professionnels. Ce dernier modèle est plus volumineux que ses prédécesseurs, ayant été formé sur plus de données et possédant plus de poids dans son fichier de modèle, ce qui le rend plus coûteux à exécuter. L’approche utilisée dans le développement du GPT-4 implique une « mise à l’échelle » pour obtenir de meilleurs résultats. Ce qui, selon de nombreux chercheurs dans le domaine, est responsable des récents progrès de l’IA.
La société a utilisé Microsoft Azure pour former GPT-4, Microsoft investissant des milliards dans la startup. Bien qu’OpenAI n’ait pas révélé de détails sur la taille spécifique du modèle ou le matériel utilisé pour sa formation, citant « le paysage concurrentiel », on sait que le modèle a été formé sur des milliers de superordinateurs, ce qui pourrait coûter des dizaines de millions de dollars.
OpenAI : ChatGPT devient beaucoup plus intelligent !
GPT-4 devrait alimenter de nombreuses démos d’intelligence artificielle dans les semaines à venir. Le chatbot AI de Bing l’utilise déjà, selon Microsoft. OpenAI affirme que le nouveau modèle produira moins de réponses factuellement incorrectes et sortira moins souvent du sujet. Il fonctionnera également mieux que les humains sur de nombreux tests, obtenant des scores au 90e centile lors d’un test du barreau simulé, au 93e centile lors d’un test de lecture SAT et au 89e centile lors de l’test SAT Math.
GPT-4 contre GPT-3.5
Selon OpenAI, alors que la différence entre GPT-3.5 et GPT-4 peut ne pas être immédiatement perceptible lors d’une conversation informelle, la supériorité de GPT-4 devient évidente lorsque la conversation approfondit. OpenAI affirme qu’à mesure que les tâches d’intelligence artificielle deviennent plus complexes, GPT-4 devrait faire preuve d’une plus grande fiabilité et créativité que son prédécesseur. OpenAI fournit également des résultats de test pour soutenir cette avancée, montrant que GPT-4 surpasse son prédécesseur dans presque tous les domaines. Les résultats des tests de GPT-4 et GPT-3.5 sont répertoriés ci-dessous :
Actualité mobile (sous-titrée) de notre partenaire de la semaine
Examens simulés | GPT-4 | GPT-4 (pas de vision) | GPT-3.5 |
Examen uniforme du barreau (MBE+MEE+MPT) | 298 / 400 ~ 90e | 298 / 400 ~ 90e | 213 / 400 ~ 10e |
LSAT | 163 ~ 88e | 161 ~ 83e | 149 ~ 40e |
Lecture et écriture fondées sur des preuves SAT | 710 / 800 ~ 93ème | 710 / 800 ~ 93ème | 670 / 800 ~ 87e |
Mathématiques SAT | 700 / 800 ~ 89e | 690 / 800 ~ 89e | 590/800 ~ 70e |
Examen du dossier d’études supérieures (GRE) Quantitatif | 163 / 170 ~ 80e | 157/170~62e | 147/170~25e |
Examen du dossier d’études supérieures (GRE) Verbal | 169 / 170 ~ 99e | 165/170~96e | 154/170~63e |
Rédaction de l’test du dossier d’études supérieures (GRE) | 4 / 6 ~ 54e | 4 / 6 ~ 54e | 4 / 6 ~ 54e |
Examen demi-finale USABO 2020 | 87 / 15099e–100e | 87 / 15099e–100e | 43 / 15031e–33e |
Examen de la section locale de l’USNCO 2022 | 36 / 60 | 38 / 60 | 24/60 |
Programme d’auto-évaluation des connaissances médicales | 75% | 75% | 53% |
Évaluation des forces de code | 392 en dessous du 5e | 392 en dessous du 5e | 260 en dessous du 5ème |
Histoire de l’art AP | 586e-100e | 586e-100e | 586e-100e |
AP Biologie | 585e-100e | 585e-100e | 462e-85e |
AP Calcul BC | 443e-59e | 443e-59e | 10e–7e |
Cependant, la société avertit que GPT-4 n’est pas parfait et est moins capable que les humains dans de nombreux scénarios. Le modèle souffre toujours d ‘«hallucinations», ou de faits inventés, et n’est pas toujours fiable sur le plan factuel. Il est enclin à insister sur le fait qu’il est correct, même lorsqu’il est faux. OpenAI a déclaré que GPT-4 a des limites qu’il s’efforce de résoudre, telles que les préjugés sociaux, les hallucinations et les invites contradictoires.
Le nouveau modèle sera disponible pour les abonnés ChatGPT payants et dans le cadre d’une API que les programmeurs peuvent intégrer dans leurs applications. OpenAI facturera environ 3 cents pour environ 750 mots d’invites et 6 cents pour environ 750 mots de réponse.
Dans l’ensemble, la sortie de GPT-4 représente une avancée significative dans le développement de l’IA et du traitement du langage naturel. Bien qu’il ne soit pas sans limites, la capacité du modèle à fonctionner au niveau humain ou au-dessus des tests standardisés suggère qu’il a le potentiel d’être un outil précieux pour un large éventail d’applications, des chatbots aux moteurs de recherche et plus encore. OpenAI continue d’affiner et d’améliorer sa technologie. Et nous pouvons nous attendre à voir des progrès encore plus impressionnants dans le domaine de l’IA dans les années à venir.