OpenAI fait un pas important avec le lancement de son nouveau modèle de raisonnement, renommé « o1 », qui promet des performances améliorées dans des domaines complexes tels que les mathématiques et la programmation. Parmi ses caractéristiques, une nouvelle méthode d’apprentissage et des résultats impressionnants lors de tests. Les détails sur ses capacités et les implications pour les utilisateurs sont à explorer.

Après des mois de spéculation et d’attente, OpenAI a mis sur le marché la version opérationnelle de son modèle avancé de raisonnement, connu sous le nom de Projet Strawberry, désormais rebaptisé “o1.” Une version “mini” fait également son apparition (à l’image de GPT-4o), offrant des interactions plus rapides et réactives, mais au prix d’une base de connaissances plus petite.
Le modèle o1 présente un ensemble d’avancées techniques variées. C’est le premier d’OpenAI conçu pour utiliser un raisonnement de type humain afin de répondre plus rapidement que les humains à des questions complexes sur divers sujets, y compris les sciences, la programmation et les mathématiques.
Par exemple, lors des tests, o1 a reçu un test de qualification pour les Olympiades Internationales de Mathématiques. Alors que son prédécesseur, GPT-4o, n’a réussi à résoudre que 13 % des problèmes, o1 a affiché un taux de réussite de 83 %. Dans une compétition en ligne Codeforces, il s’est classé dans le 89e percentile. De plus, o1 est capable de répondre à des questions qui avaient déconcerté les modèles précédents (comme, “lequel est plus grand, 9.11 ou 9.9 ?”). Cependant, la société précise que cette version n’est qu’un aperçu des capacités complètes du modèle novice.
Le nouvel o1 “a été formé en utilisant un tout nouvel algorithme d’optimisation et un ensemble de données d’entraînement spécifiquement conçu pour lui,” a déclaré Jerry Tworek, responsable de recherche chez OpenAI, à The Verge. En utilisant une combinaison d’apprentissage par renforcement et de raisonnement par “chaîne de pensée”, o1 fournirait des inférences plus précises que son prédécesseur. “Nous avons remarqué que ce modèle hallucine moins,” a poursuivi Tworek, toutefois, “nous ne pouvons pas dire que nous avons résolu le problème des hallucinations.”
Les abonnés à ChatGPT-Plus et Teams pourront tester o1 et o1-mini dès aujourd’hui. Les abonnés Entreprise et Edu devraient avoir accès la semaine prochaine.
La société a annoncé que o1-mini sera finalement accessible aux utilisateurs gratuits, sans pour autant préciser de date. Les développeurs vont remarquer une augmentation significative des tarifs de l’API pour o1, par rapport à GPT-4o. L’accès à o1 coûtera 15 $ par million de tokens d’entrée (contre 5 $ par million pour GPT-4o) et 60 $ par million de tokens de sortie, ce qui représente quatre fois le tarif de 5 $ des tokens de sortie de 4o. La question qui se pose est de savoir si le nouveau modèle considère que le mot “strawberry” contient deux ou trois R.
