Claude d'Anthropic peut désormais contrôler les ordinateurs comme les humains

Anthropic dévoile Claude 3.5 Sonnet, une version améliorée de son IA, qui promet des performances supérieures en codage tout en permettant un contrôle de l’ordinateur via une API. Les utilisateurs peuvent lui confier des tâches, transformant Claude en un agent capable d’automatiser divers processus, tout en restant sous le contrôle humain.

Claude 3.5 Sonnet d’Anthropic, déjà impressionnant, reçoit un coup de pouce significatif ce mardi avec le lancement d’une version améliorée qui s’accompagne d’un nouveau modèle léger, le Claude 3.5 Haiku. La mise à jour de Sonnet inclut une fonctionnalité beta publique permettant à l’IA de contrôler de manière basique l’ordinateur sur lequel elle fonctionne.

Le Claude 3.5 Sonnet était déjà un leader en matière de performance pour les tâches de codage, mais la nouvelle version montre des améliorations notables par rapport à son prédécesseur et surpasse régulièrement Gemini 1.5 et GPT-4o dans divers benchmarks de l’industrie. Seul le modèle Gemini 1.5 Pro a réussi à surpasser le nouveau 3.5 Sonnet dans un test, et c’était sur le benchmark MATH.

Le 3.5 Haiku, bien que de petite taille, ne démérite pas non plus. Prévu pour être lancé plus tard ce mois-ci, le 3.5 Haiku surpasse le Claude 3.0 Opus, le plus grand modèle de génération précédente de l’entreprise. Comme sa version plus grande, le nouvel Haiku est extrêmement compétent dans les tâches de codage, obtenant un score de 40,6 % sur le SWE-bench Vérifié — supérieur à la fois à GPT-40 et à l’original 3.5 Sonnet.

Encore plus impressionnant, le nouveau Claude 3.5 Sonnet peut interagir avec les applications de bureau via l’API “Utilisation de l’Ordinateur”. L’IA peut générer les frappes nécessaires, les clics de souris, et les mouvements nécessaires pour émuler l’utilisateur humain. L’entreprise précise que le système est encore expérimentale et sujet aux erreurs. Le but de la sortie beta publique est de recueillir des retours d’expérience des développeurs pour améliorer rapidement les performances de l’API.

“Nous avons entraîné Claude à voir ce qui se passe sur un écran et à utiliser les outils logiciels disponibles pour réaliser des tâches,” a écrit Anthropic dans un article de blog. “Lorsqu’un développeur demande à Claude d’utiliser un logiciel et lui donne l’accès nécessaire, Claude examine des captures d’écran de ce qui est visible pour l’utilisateur, puis compte combien de pixels, verticalement ou horizontalement, il faut pour déplacer un curseur afin de cliquer au bon endroit.”

C’est essentiellement un agent IA. C’est-à-dire, une IA qui peut automatiser d’autres processus logiciels, que ce soit pour générer et qualifier des prospects marketing, découvrir des motifs et des tendances dans des données médicales, ou simplement naviguer vers un site Web spécifique et remplir un formulaire dont vous avez besoin. Pensez à eux comme à une version plus avancée des systèmes existants d’Automatisation des Processus Robotisés.

L’entreprise cite Asana, Canva, Cognition, DoorDash, Replit et The Browser Company comme des adopteurs précoces de la nouvelle fonctionnalité. Par exemple, Replit utilise le Contrôle de l’Ordinateur pour “développer une fonctionnalité clé qui évalue les applications au fur et à mesure de leur conception pour leur produit Replit Agent,” selon l’annonce.

Il n’y a pas lieu de s’inquiéter que l’IA prenne le contrôle (pour l’instant), comme l’explique Anthropic. “Les humains restent aux commandes en fournissant des invites spécifiques qui dirigent les actions de Claude, comme ‘utiliser les données de mon ordinateur et en ligne pour remplir ce formulaire,’” a déclaré un porte-parole d’Anthropic à TechCrunch. “Les personnes permettent et limitent l’accès selon leurs besoins. Claude décompose les invites de l’utilisateur en commandes informatiques (par exemple, déplacer le curseur, cliquer, taper) pour accomplir cette tâche spécifique.”

Anthropic accepte également que le Contrôle de l’Ordinateur puisse être détourné pour générer du spam, diffuser de la désinformation ou commettre des fraudes. En réponse, l’entreprise a développé de nouveaux classificateurs pour identifier lorsque l’API est utilisée et si cette utilisation “cause du tort.”

Claude d’Anthropic peut désormais contrôler les ordinateurs comme les humains

Offres JIMMY Prime Day : Grosses réduction sur les purificateurs d’eau et aspirateurs anti-acariens

Lymow One Plus : la tondeuse autonome aux doubles lames rotatives à -18% !

Jimmy : Aspirateurs anti-acariens indispensables en promo jusqu’au 26 juin !

Tu n’es pas fou, il y a une raison pour laquelle la batterie de ton téléphone tient moins longtemps en été

Tout ce que vous pouvez faire pour résoudre les problèmes de l’application Cita Sanitaria avant de vous décourager

Mole l’outil gratuit pour nettoyer optimiser et surveiller votre Mac

Photoshop, Lightroom et sept autres applications pour retoucher vos photos comme un pro

China réussit à récupérer sa fusée ! La suprématie spatiale de Elon Musk menacée

TEST UGREEN Maxidok 17 en 1 Thunderbolt 5 : Notre verdict sur la station d’accueil qui fait tout

TEST AFERIY P280 + Extension : Batterie de 4096Wh à 1439€, le meilleur rapport qualité-prix ?

TEST UGREEN Maxidok 10 en 1 Thunderbolt 5 pour Mac Mini : La station d’accueil parfaitement taillée ?