OpenAI déploie sa fonctionnalité de voix avancée et introduit cinq nouvelles voix pour ses utilisateurs de ChatGPT Plus et Teams. Ce système permet de communiquer directement avec le chatbot, sans saisie textuelle, et propose des outils tels que la mémoire et des instructions personnalisées pour améliorer l’expérience utilisateur.

OpenAI a annoncé sur Twitter mardi le déploiement de sa fonctionnalité de voix avancée, ainsi que de cinq nouvelles voix pour son IA conversationnelle, destinées aux abonnés des niveaux Plus et Teams au cours de cette semaine. Les abonnés Enterprise et Edu auront accès à ces nouvelles fonctionnalités dès la semaine prochaine.
La voix avancée est déployée pour tous les utilisateurs Plus et Teams dans l’application ChatGPT tout au long de la semaine.
En attendant, nous avons ajouté des instructions personnalisées, une mémoire, cinq nouvelles voix et amélioré les accents.
Elle peut également dire « Désolé, je suis en retard » en plus de 50 langues. pic.twitter.com/APOqqhXtDg
— OpenAI (@OpenAI) 24 septembre 2024
La voix avancée, qui fonctionne sur le modèle GPT-4o, permet aux utilisateurs de parler directement avec le chatbot, comme ils le feraient avec une autre personne, sans avoir besoin d’utiliser des invites textuelles. Cette fonctionnalité a été présentée lors de l’événement de mise à jour du printemps d’OpenAI et a été testée en version bêta par un groupe sélectionné d’abonnés ChatGPT Plus en juillet. Désormais, tous les abonnés payants auront l’occasion de l’essayer.
L’entreprise a également dévoilé cinq nouvelles voix pour le chatbot : Arbor, Maple, Sol, Spruce et Vale (vous pouvez les écouter dès maintenant). Celles-ci seront disponibles dans les modes voix standard et avancée, s’ajoutant ainsi aux quatre voix que ChatGPT propose déjà : Breeze, Juniper, Cove et Ember. OpenAI a également précisé que les fonctionnalités de partage vidéo et d’écran ne sont pas encore disponibles dans le mode voix avancée, mais seront ajoutées ultérieurement.
De plus, OpenAI intègre deux outils pour aligner les capacités de voix avancée avec l’expérience globale du chatbot textuel : la mémoire et les instructions personnalisées. Lors de son lancement, la voix avancée ne pouvait faire référence qu’aux informations de la conversation en cours. Avec la fonction de mémoire, l’IA sera en mesure de se souvenir des détails des conversations précédentes, ce qui réduira le besoin pour les utilisateurs de se répéter. De même, les instructions personnalisées visent à établir des règles que le modèle doit suivre lors de la génération de ses réponses. Par exemple, vous pourriez indiquer que toute réponse basée sur le codage doit être présentée en Python.

Les abonnés Plus et Teams recevront une notification dans l’application lorsque la fonctionnalité sera activée sur leur compte. Malheureusement, la voix avancée n’est pas disponible dans l’UE, au Royaume-Uni, en Suisse, en Islande, en Norvège et au Liechtenstein.
ChatGPT n’est pas le seul IA capable de converser directement avec ses utilisateurs. L’annonce de mardi survient moins de quinze jours après que Google a lancé son Gemini Live pour tous les utilisateurs, y compris ceux du niveau gratuit.
