OpenAI ouvre l’accès aux développeurs au modèle de raisonnement complet o1

1734477765 Openai Ouvre Lacces Aux Developpeurs Au Modele De Raisonnement Complet.jpg

OpenAI a récemment lancé la version complète de son modèle de raisonnement o1, accessible à des développeurs triés sur le volet via son API. Avec des coûts élevés, le modèle offre de nouvelles fonctionnalités améliorées, promettant une expérience plus personnalisée et des interactions vocales révolutionnaires à l’avenir.

Le logo o1 d'OpenAI

Le neuvième jour de la campagne de presse d’OpenAI, l’entreprise a annoncé le lancement de la version complète de son modèle de raisonnement o1 pour des développeurs sélectionnés via l’API de la société. Jusqu’à cette annonce, les développeurs n’avaient accès qu’au modèle de prévisualisation o1, moins performant.

Selon la société, le modèle complet o1 commencera à être déployé auprès des utilisateurs de la catégorie « Tier 5 » d’OpenAI. Il s’agit d’utilisateurs ayant un compte depuis plus d’un mois et dépensant au moins 1 000 € avec la société. Ce nouveau service est particulièrement coûteux, en raison des ressources informatiques supplémentaires nécessaires pour o1, coûtant 15 € pour chaque (environ) 750 000 mots analysés et 60 € pour chaque (environ) 750 000 mots générés par le modèle. Cela représente trois à quatre fois le coût de l’exécution des mêmes tâches avec GPT-4o.

À ces tarifs, OpenAI a veillé à améliorer les capacités du modèle complet par rapport à l’itération de prévisualisation. Le nouveau modèle o1 est plus personnalisable que son prédécesseur (son nouveau paramètre « reasoning_effort » détermine le temps que l’IA prend pour réfléchir à une question donnée) et offre des appels de fonction, des messages développeur et une analyse d’image, tous absents du modèle de prévisualisation o1.

L’entreprise a également annoncé qu’elle intègre ses modèles GPT-4o et 4o-mini dans son API en temps réel, conçue pour des applications vocales à faible latence (comme le mode vocal avancé). L’API prend également désormais en charge WebRTC, la norme ouverte de l’industrie pour développer des applications vocales dans les navigateurs web, préparant ainsi le terrain pour de nombreux sites web interagissant vocalement avec vous d’ici 2025.

“Notre intégration WebRTC est conçue pour permettre des interactions fluides et réactives dans des conditions réelles, même avec une qualité de réseau variable,” a déclaré OpenAI dans son annonce. “Elle gère l’encodage audio, le streaming, la suppression de bruit et le contrôle de congestion.”

OpenAI a, jusqu’à présent, dans le cadre de l’événement en direct, dévoilé la version complète de o1 (en plus de l’annonce de mardi), lancé son modèle de génération vidéo Sora, présenté sa nouvelle fonctionnalité Projets et fourni plusieurs mises à jour de ses fonctionnalités Canvas, Recherche et Mode Vocal Avancé.

Avec seulement trois jours restants avant la finale de l’événement, que va montrer OpenAI ensuite ? Nous devrons attendre pour le découvrir.