ChatGPT a franchi un nouveau cap en développant la capacité de traiter des vidéos en temps réel, une avancée très attendue. Bien que des défis subsistent pour devenir le chatbot ultime, OpenAI cherche à rivaliser avec Google et son projet Astra, promettant des fonctionnalités innovantes et captivantes.
ChatGPT est désormais capable de voir ce qui l’entoure : découvrez le nouveau mode de vision du chatbot

ChatGPT est enfin capable de traiter des vidéos, et OpenAI a lancé une de ses caractéristiques les plus anticipées. Au cours des derniers mois, des rumeurs circulaient sur l’arrivée de cette fonction, mais ce n’est que cette semaine qu’OpenAI a activé cette possibilité. Qu’est-ce qu’il reste à ChatGPT pour devenir le chatbot de référence ? Effetivement, il reste du chemin à parcourir, mais OpenAI a opéré les avancées nécessaires pour essayer de prendre de l’avance sur ses concurrents dans le domaine de l’IA.
Le traitement d’images en temps réel constitue l’un des atouts majeurs des avancées de ChatGPT. Ce n’est pas la première fois que nous assistons à une évolution dans ce domaine, puisque Google a récemment démontré les capacités de Project Astra avec le lancement de Gemini 2.0. La stratégie d’OpenAI semble clairement destinée à se positionner en concurrence directe avec celle de Google ; examinons en détail ce que peut offrir ChatGPT.
ChatGPT est désormais capable de voir ce qui l’entoure : découvrez le nouveau mode de vision du chatbot
Le lancement de cette innovation a été accompagné d’une vidéo publiée sur YouTube montrant en détail le comportement de ChatGPT lors de ce processus. Le modèle à l’origine de cette nouveauté est GPT-4o, un modèle multimodal pouvant traiter des images en temps réel et réagir en fonction de ce qu’il observe.
Cette nouvelle fonctionnalité sera intégrée à ChatGPT de telle manière que, une fois disponible, il suffira d’ouvrir l’application mobile et de cliquer sur l’icône permettant d’accéder au mode de voix avancé. Ce mode donne accès à la capacité de ChatGPT de traiter des vidéos, tout en permettant de choisir d’utiliser la caméra arrière ou avant.
Cette nouvelle caractéristique sera déployée dans les jours à venir, bien qu’aucune date précise de disponibilité n’ait été fournie. En revanche, la fonctionnalité sera d’abord lancée pour les utilisateurs de ChatGPT Plus et ChatGPT Pro. Naturellement, les utilisateurs de l’Union Européenne devront attendre un certain temps avant de bénéficier de cette nouveauté.
Il est évident qu’OpenAI souhaite rivaliser avec la concurrence; la capacité de ChatGPT à percevoir son environnement représente un changement majeur. Reste à voir comment cela s’intégrera dans les applications et les projets qui peuvent être réalisés grâce à cette innovation.
