Google a partagé une vidéo via X dans laquelle vous pouvez voir une nouvelle fonctionnalité d’IA qui vous permet d’utiliser la caméra de votre téléphone portable pour identifier tout ce qui vous entoure.

Nous sommes à quelques heures de la conférence des développeurs de Google de cette année, le Google I/O 2024, qui a déjà dévoilé une programmation mettant en avant les nouveautés d’Android 15 et de Wear OS 5, et qui réservera également une place pour que la grande G nous présente ses améliorations en matière d’IA générative.
Dans ce sens, la société de Mountain View a voulu donner un avant-goût en dévoilant l’une de ses nouvelles avancées en matière d’IA avant le Google I/O 2024, puisque le géant américain vient d’annoncer une nouvelle fonctionnalité qui vous permettra d’utiliser la caméra du téléphone portable pour reconnaître ce qui vous entoure.
Google prend de l’avance sur l’I/O 2024 et présente l’une de ses grandes nouveautés en IA pour cette année.
Comme nous le confirme le média Engadget, récemment, Google a publié un article sur X, l’ancien Twitter, dans lequel il nous montre une brève vidéo d’une nouvelle fonctionnalité d’IA qui vous permet d’utiliser la caméra du smartphone pour identifier, en temps réel, ce qui vous entoure.
One more day until #GoogleIO! We’re feeling 🤩. See you tomorrow for the latest news about AI, Search and more. pic.twitter.com/QiS1G8GBf9
— Google (@Google) 13 mai 2024
La vidéo qui accompagne ledit article, que vous pouvez voir ci-dessus, est étiquetée avec le mot « prototype » et nous montre une personne avec un Google Pixel avec la caméra ouverte en train de questionner le smartphone sur ce qu’il voit.
Ainsi, par exemple, à la question « hé, que penses-tu qu’il se passe ici ? », cette nouvelle fonctionnalité d’IA de Google répond vocalement à l’utilisateur du Pixel en disant « il semble que les personnes se préparent pour un grand événement, peut-être une conférence ou une présentation ». De plus, nous pouvons également constater que cette nouvelle fonctionnalité est capable de reconnaître les lettres « I/O » et de les associer à la conférence des développeurs de Google, à tel point qu’elle mentionne que lors de cet événement, de nouvelles avancées en intelligence artificielle seront annoncées.
De plus, tout au long de la conversation entre l’IA et l’utilisateur, une transcription textuelle apparaît sur l’écran, montrant ce que disent les deux voix.
Il semble donc que nous assistions à la naissance d’une version de Google Lens alimentée par l’IA, qui fonctionne en temps réel et est capable de répondre aux commandes vocales de manière très similaire à l’IA multimodale des lunettes intelligentes de Meta.
Il n’est pas habituel que Google annonce l’une de ses avancées en IA les plus remarquables avant sa grande keynote, mais sans doute, cette fois-ci, il l’a fait pour contrer l’impact de l’annonce d’hier de GPT-4o, le nouveau modèle de langage d’OpenAI qui sera bientôt disponible sur ChatGPT.
