Lors de Cloud Next, Google mise sur l’IA partout !

Lors De Cloud Next, Google Mise Sur L'ia Partout !

Les annonces récentes de Google lors de l’événement Cloud Next mettent en avant une direction future centrée sur des applications hybrides alimentées par l’IA. Avec des améliorations significatives dans l’infrastructure et des outils dédiés aux agents, la stratégie de Google pourrait bien transformer l’utilisation de l’IA dans divers environnements.

Il y a eu de nombreuses discussions récemment sur l’évolution des applications d’IA, mais les annonces faites par Google lors de l’événement Cloud Next à Las Vegas semblent indiquer que l’hybride est la voie vers laquelle ces développements se dirigent.

Pour être clair, Google a présenté une gamme impressionnante d’annonces lors de Cloud Next, mais aucune communication officielle n’a spécifiquement mentionné l’IA hybride.

Cependant, en prenant du recul et en analysant la manière dont plusieurs éléments s’imbriquent, il apparaît que les applications et agents alimentés par GenAI, qui exploitent une combinaison de cloud public, de clouds privés d’entreprise et même de dispositifs intelligents – c’est-à-dire l’IA hybride – semblent inévitables.

Youtube video

Quelques moments forts d’abord. En ce qui concerne l’infrastructure cloud, Google a fait plusieurs annonces importantes lors de Cloud Next, se concentrant principalement sur l’élargissement des options d’architecture informatique proposées aux clients de GCP.

En particulier, la société a révélé son processeur TPU de septième génération, surnommé Ironwood, qui est une alternative conçue en interne aux GPU et le premier spécifiquement conçu pour les charges de travail d’inférence. En plus des améliorations de performance de 10x par rapport aux générations précédentes, ce qui impressionne avec ces dernières versions, c’est l’étendue des options de connectivité chip-to-chip à haute vitesse que Google proposera entre elles.

Empruntant à l’architecture NVLink de NVIDIA, la dernière architecture hyperordinateur de Google permet d’interconnecter jusqu’à 9 216 de ces TPUs de Gen 7 en un seul pod de calcul, offrant suffisamment de bande passante pour même les plus grands des nouveaux modèles de raisonnement basés sur les chaînes de pensée qui commencent à devenir disponibles. En fait, Google a déclaré qu’un système entièrement utilisé pourrait atteindre jusqu’à 42,5 exaflops, soit plus de 24 fois la puissance de calcul du superordinateur le plus rapide d’aujourd’hui.

Lors de Cloud Next Google mise sur lIA partout

Un autre grand thème du discours d’ouverture de Cloud Next concernait les agents, y compris les outils pour les construire, les connecter et les intégrer plus facilement avec une variété de LLM.

Renforçant l’annonce précédente de l’Agentspace de l’entreprise – qui permet aux employés d’entreprise d’utiliser les capacités de recherche multimodale de Google sur les données d’entreprise et de construire leurs propres agents de manière low code/no code – Google a également dévoilé un nouveau Kit de développement d’agents pour les développeurs dans le cadre de sa plateforme Vertex AI.

Encore plus important, la société a annoncé son protocole Agent2Agent (A2A), qui vise à standardiser les moyens par lesquels différents agents peuvent « communiquer » entre eux et partager des informations. A2A s’appuie sur le Model Context Protocol (MCP) d’Anthropic introduit l’année dernière, qui est en train de gagner rapidement en popularité dans le monde de l’IA.

En fait, le fort support de Google au MCP à travers une gamme de produits introduits ici lors de Cloud Next a vraiment conduit aux conclusions sur l’IA hybride que j’ai exposées plus tôt. Le MCP offre un moyen standardisé pour les modèles de se connecter à une variété de sources de données différentes, au lieu de devoir gérer des API propriétaires, et fournit un moyen standardisé par lequel les modèles peuvent exposer les différentes fonctions qu’ils sont capables d’exécuter sur ces jeux de données.

Ce processus signifie que le MCP résout certains problèmes majeurs dans la création d’applications alimentées par l’IA qui peuvent puiser dans des ressources de données locales et ouvre un monde de possibilités intrigantes pour créer des applications d’IA distribuées qui peuvent exploiter des sources de données, d’autres modèles et d’autres infrastructures de calcul à travers différents lieux physiques. C’est cette capacité qui rend le MCP si intéressant et qui explique probablement une bonne partie de la rapidité de son adoption.

Google a rendu l’impact potentiel du MCP beaucoup plus concret en annonçant qu’il permettra désormais aux organisations d’intégrer les modèles Gemini, Agentspace et d’autres outils d’IA dans leurs environnements de cloud privé/données sur site via le Google Distributed Cloud au troisième trimestre de cette année. Il s’agit d’un développement incroyablement important car cela signifie que les sociétés construisant des applications avec des outils basés sur Google Cloud peuvent les utiliser à travers de nombreux environnements différents.

Par exemple, il serait possible pour une organisation d’exploiter les ressources pratiquement illimitées de l’infrastructure cloud public de Google pour exécuter certaines fonctions avec certains modèles et jeux de données stockés là-bas, tout en exécutant d’autres fonctions sur différents modèles qui accèdent à des données derrière le pare-feu au sein de leurs environnements de cloud privé ou de centre de données.

Cela résout le problème de la gravité des données auquel de nombreuses organisations ont été confrontées alors qu’elles commencent à envisager d’exploiter les capacités puissantes des LLM les plus avancés d’aujourd’hui, car cela leur permet essentiellement de bénéficier du meilleur des deux mondes. Cela leur offre un calcul massif basé sur le cloud avec des données stockées dans le cloud public et un calcul local avec les grands ensembles de données propriétaires souvent les plus précieux que de nombreuses organisations conservent (ou souhaitent rapatrier) dans leurs propres environnements.

De plus, il est même possible d’étendre la nature distribuée de l’environnement de calcul aux PC et smartphones, en particulier à mesure que la disponibilité des appareils dotés de capacités d’accélération AI plus puissantes augmente. Bien que cette dernière étape ne se produise probablement pas du jour au lendemain, elle deviendra une capacité essentielle à mesure que les entreprises chercheront à réduire l’électricité et les coûts de leurs applications d’IA à l’avenir.

Youtube video

En parlant de capacités sur appareil, Google a également annoncé plusieurs améliorations à son offre de productivité Workspace lors de l’événement Cloud Next de cette année. Les nouvelles fonctionnalités alimentées par l’IA comprennent des flux de travail axés sur l’automatisation, des fonctionnalités audio dans Docs et plus encore. Celles-ci s’appuient sur de nombreuses fonctions précédentes alimentées par l’IA que Google a intégrées à Workspace plus tôt cette année, y compris un accès gratuit à la version la plus avancée du modèle Gemini, de nouvelles fonctions d’analyse de données dans Sheets, l’analyse de documents et la synthèse à travers toutes les applications Workspace, et bien plus encore.

Comme lors des précédents événements Cloud Next, il y a eu de nombreuses autres annonces que Google a abordées dans des domaines tels que les bases de données, les outils de création de code, le studio de création d’agents Firebase, l’accès au réseau privé Cloud WAN, les améliorations de sécurité et bien plus encore.

C’est un peu écrasant de tout comprendre, pour être honnête, mais cela démontre à quel point les offres basées sur le cloud continuent d’évoluer rapidement, en particulier avec l’intégration des développements des modèles de fondation d’IA qui avancent à un rythme encore plus rapide.

En fin de compte, il est clair que Google utilise sa longue histoire de développements en IA ainsi que les récentes avancées réalisées avec les modèles Gemini et d’autres outils d’IA comme un différenciateur clair pour Google Cloud. Ce faisant, il continue de se positionner de manière unique, non seulement pour les applications actuelles, mais aussi pour les applications d’IA hybrides à venir.