Les améliorations de GenAI, enfin les promesses d’assistants numériques vraiment utiles

GenAI improvements bring back the promise of truly useful digital assistants

Futur : Vous vous souvenez quand nous pensions que Siri, Alexa et Google Assistant allaient être vraiment utiles ? Ouais moi aussi. Dix ans plus tard, nous commençons à voir des démonstrations beaucoup plus impressionnantes montrant à quel point les assistants numériques ont progressé. Les possibilités semblent à la fois convaincantes et intrigantes.

Lundi, OpenAI a dévoilé son nouveau modèle GPT-4o et la mise à jour qui l’accompagne de ChatGPT, qui permet non seulement de parler avec ChatGPT, mais aussi de le faire de manière étrangement réaliste. Le nouveau modèle vous permet de l’interrompre pour un flux de conversation un peu plus naturel et répond avec plus de personnalité et d’émotion que ce que nous avons entendu de la part d’autres assistants numériques.

Avec les applications ChatGPT mises à jour pour iOS et Android, il peut également voir et comprendre plus de choses via l’appareil photo d’un smartphone. Par exemple, OpenAI a présenté une application d’aide aux devoirs qui pourrait guider les élèves à travers des problèmes mathématiques simples à l’aide de l’appareil photo.

Youtube video

Mardi, Google a dévoilé une vaste gamme de mises à jour de son modèle Gemini lors de son événement pour les développeurs d’E/S, y compris une fonction d’aide aux devoirs similaire au sein d’Android lui-même. Google a également présenté des résumés d’IA basés sur Gemini pour la recherche, des applications plus sophistiquées de Gemini dans Google Workspace et un nouvel algorithme de conversion texte-vidéo appelé Veo qui s’apparente au modèle Sora récemment introduit par OpenAI.

Les démos des deux sociétés exploitaient des technologies similaires que de nombreuses autres sociétés développent clairement en parallèle. Plus important encore, ils ont souligné que certaines capacités essentielles nécessaires à la création d’assistants personnels numériques intelligents sont presque à portée de main.

Le premier est la prise en charge de plus en plus large de modèles multimodaux capables de prendre en charge des entrées audio, vidéo, image et texte plus sophistiquées, puis d’établir des liens entre eux. Ces connexions ont rendu les démos magiques car elles imitent la façon dont nous, les êtres humains, percevons le monde qui nous entoure. Pour faire simple, ils ont finalement démontré comment nos appareils intelligents pouvaient réellement être « intelligents ».

Youtube video

Un autre développement apparent est la sophistication croissante des agents qui comprennent le contexte et l’environnement et raisonnent à travers des actions en notre nom. La démonstration du projet Astra de Google, en particulier, a montré comment l’intelligence contextuelle combinée au raisonnement, aux connaissances personnelles/locales et à la mémoire pouvait créer une interaction qui donnait l’impression que l’assistant IA était « réel ».

Actuellement, les définitions de ce qu’est un agent basé sur l’IA et de ce qu’il peut faire ne sont pas cohérentes dans l’ensemble du secteur, ce qui rend difficile la généralisation de leurs avancées. Néanmoins, la similitude temporelle et conceptuelle de ce qu’OpenAI et Google ont démontré montre clairement que nous sommes beaucoup plus près d’avoir des assistants numériques fonctionnels que je pense que la plupart des personnes ne le pensent. Même si les démos ne sont pas parfaites, les capacités qu’elles ont montrées et les possibilités qu’elles impliquent suggèrent que nous sommes très près d’avoir dans nos appareils des capacités qui relevaient du domaine de la science-fiction il y a seulement quelques années.

Aussi grandes que puissent être les applications potentielles, il reste cependant à convaincre les personnes que ces types de capacités basées sur GenAI valent la peine d’être utilisées régulièrement. Après que le battage médiatique initial autour de ChatGPT ait commencé à ralentir vers la fin de l’année dernière, l’adoption de la technologie a été plus modeste que certaines personnes ne l’avaient prévu. Il reste à voir si ces types d’applications d’assistant numérique peuvent ou non devenir le déclencheur qui incitera un grand nombre de personnes à commencer à utiliser les fonctionnalités basées sur GenAI. Il est tout aussi important de savoir s’ils peuvent ou non commencer à changer la vie des personnes de la même manière que certains ont prédit que l’IA générative pourrait le faire.

Bien sûr, une partie du problème réside dans le fait que – comme pour toute autre technologie conçue pour personnaliser les expériences et les informations à leur manière – les personnes doivent être prêts à laisser ces produits et ces entreprises avoir un accès plus profond à leur vie qu’ils ne l’ont jamais fait. s’ils veulent en tirer pleinement profit. Qu’on le veuille ou non, la seule façon d’obtenir un assistant numérique efficace est de pouvoir accéder sans entrave à vos fichiers, communications, habitudes de travail, contacts et bien plus encore. À une époque où l’on s’inquiète de plus en plus de l’impact des entreprises et des produits technologiques, cela pourrait s’avérer difficile à convaincre.

Aux États-Unis, tout dépendra des capacités que Microsoft et Apple dévoileront lors de leurs conférences de développeurs dans les semaines à venir. Compte tenu de la part dominante de l’iPhone sur le marché américain des smartphones, les capacités basées sur GenAI qu’Apple choisit d’activer influenceront considérablement ce que les personnes considèrent comme acceptable et important (que ce soit par le biais de son propre développement ou sous licence via OpenAI ou Google, comme le fait la société. ).

Appelez cela la vengeance de Siri, mais toute technologie d’assistant ou d’agent numérique annoncée par Apple pour la prochaine version d’iOS aura une influence démesurée sur le nombre de personnes qui percevront ces avancées technologiques à court terme.

En fin de compte, la question se résume également à savoir dans quelle mesure les personnes sont disposés à s’attacher encore plus à leurs appareils numériques et aux applications et services qu’ils permettent. Étant donné le temps énorme et croissant que nous passons déjà avec eux, cela peut être acquis d’avance. Cependant, la question reste de savoir si les personnes percevront certaines de ces capacités des assistants numériques comme allant trop loin. Une chose est sûre : cette tendance sera intéressante à suivre.

Détente, découvrez l’évolution du nombre de smartphones vendus par marque au fil du temps dans la vidéo ci-dessous :

Youtube video