Perplexity vient de lancer un mode vocal amélioré pour son navigateur Comet. Les utilisateurs de bureau peuvent l’essayer immédiatement. Les utilisateurs d’iOS devront patienter quelques jours de plus. Cette mise à jour permet de contrôler tout en mains libres. Ouvrez des sites, faites défiler des pages ou suivez des liens, le tout par la voix.
Sur le bureau, il suffit d’appuyer sur Shift + Alt + V, ou Shift + Option + V sur un Mac. Sur iPhone, les mêmes outils arriveront bientôt, transformant Comet en ce qui pourrait être le premier navigateur mobile entièrement contrôlé par la voix.
Cette fonctionnalité fonctionne avec le dernier modèle en temps réel d’OpenAI. Le PDG Aravind Srinivas a annoncé le déploiement sur X et a remercié l’équipe multimodale d’OpenAI. L’objectif est une navigation complète dans le navigateur par la voix, et pas seulement une recherche vocale.
Construit sur la dernière technologie vocale d’OpenAI
Ce mode vocal utilise le modèle gpt-realtime-1.5 d’OpenAI, conçu pour les agents vocaux à faible latence. Srinivas a crédité l’équipe d’OpenAI, et Perplexity affirme avoir amélioré la stabilité des appels d’outils de plus de 25 %. Cela signifie moins d’erreurs lorsque vous demandez au navigateur d’effectuer une action. Les voix sonnent également mieux, avec un rythme adapté aux sessions d’écoute prolongées.
Nous déployons un mode vocal amélioré sur Comet. C’est la première fois que vous pouvez contrôler complètement le navigateur sans les mains. Comet pour iOS bénéficiera de cette mise à jour dans quelques jours. Précommandez si ce n’est pas déjà fait !
Pourquoi le contrôle vocal intégral est important maintenant
La plupart des navigateurs considèrent la voix comme un gadget. Vous posez une question, les résultats apparaissent, puis vous tapez. Comet souhaite que la voix vous accompagne tout au long de la session. Demandez ce que vous voyez à l’écran. Essayez de dire “faire défiler vers le bas, ouvrir le troisième lien, résumer cette page, comparer avec l’onglet de gauche.” Aucune utilisation de clavier requise.
Ce lancement coïncide avec un passage vers l’informatique ambiante. Perplexity parie que le web fonctionne mieux lorsque vous lui parlez. Sur desktop, la fonctionnalité est déjà disponible.
Comet adopte également une approche différente en matière de confidentialité. Il traite les voix localement lorsque cela est possible et ne stocke pas les historiques de clics dans le cloud par défaut. Pas de profils de suivi publicitaire basés sur votre navigation.
À surveiller dans les jours à venir
Les utilisateurs de bureau peuvent tester le mode vocal dès aujourd’hui. Pour iOS, cela devrait arriver autour du 11 mars selon les précommandes de l’App Store. La véritable question est de savoir si les contrôles paraîtront naturels dans des tâches réelles, et pas seulement lors des démonstrations.
Perplexity construit déjà davantage. Comet Assistant apprend vos préférences et peut aider avec les achats, les commandes de nourriture, ou la recherche de vols en fonction de vos habitudes. Un gestionnaire de mots de passe et une synchronisation multiplateforme sont en préparation. Les utilisateurs d’Android attendent ces fonctionnalités. Pour iOS, cette mise à niveau vocale n’est que la première étape.
