Claude d’Anthropic peut désormais contrôler les ordinateurs comme les humains

1729641168 Claude Danthropic Peut Desormais Controler Les Ordinateurs Comme Les Humains.webp.jpeg

Anthropic dévoile Claude 3.5 Sonnet, une version améliorée de son IA, qui promet des performances supérieures en codage tout en permettant un contrôle de l’ordinateur via une API. Les utilisateurs peuvent lui confier des tâches, transformant Claude en un agent capable d’automatiser divers processus, tout en restant sous le contrôle humain.

le logo de contrôle de l'ordinateur Claude

Claude 3.5 Sonnet d’Anthropic, déjà impressionnant, reçoit un coup de pouce significatif ce mardi avec le lancement d’une version améliorée qui s’accompagne d’un nouveau modèle léger, le Claude 3.5 Haiku. La mise à jour de Sonnet inclut une fonctionnalité beta publique permettant à l’IA de contrôler de manière basique l’ordinateur sur lequel elle fonctionne.

Le Claude 3.5 Sonnet était déjà un leader en matière de performance pour les tâches de codage, mais la nouvelle version montre des améliorations notables par rapport à son prédécesseur et surpasse régulièrement Gemini 1.5 et GPT-4o dans divers benchmarks de l’industrie. Seul le modèle Gemini 1.5 Pro a réussi à surpasser le nouveau 3.5 Sonnet dans un test, et c’était sur le benchmark MATH.

Le 3.5 Haiku, bien que de petite taille, ne démérite pas non plus. Prévu pour être lancé plus tard ce mois-ci, le 3.5 Haiku surpasse le Claude 3.0 Opus, le plus grand modèle de génération précédente de l’entreprise. Comme sa version plus grande, le nouvel Haiku est extrêmement compétent dans les tâches de codage, obtenant un score de 40,6 % sur le SWE-bench Vérifié — supérieur à la fois à GPT-40 et à l’original 3.5 Sonnet.

nouveau graphique de performance de Claude 3.5 sonnet

Encore plus impressionnant, le nouveau Claude 3.5 Sonnet peut interagir avec les applications de bureau via l’API “Utilisation de l’Ordinateur”. L’IA peut générer les frappes nécessaires, les clics de souris, et les mouvements nécessaires pour émuler l’utilisateur humain. L’entreprise précise que le système est encore expérimentale et sujet aux erreurs. Le but de la sortie beta publique est de recueillir des retours d’expérience des développeurs pour améliorer rapidement les performances de l’API.

“Nous avons entraîné Claude à voir ce qui se passe sur un écran et à utiliser les outils logiciels disponibles pour réaliser des tâches,” a écrit Anthropic dans un article de blog. “Lorsqu’un développeur demande à Claude d’utiliser un logiciel et lui donne l’accès nécessaire, Claude examine des captures d’écran de ce qui est visible pour l’utilisateur, puis compte combien de pixels, verticalement ou horizontalement, il faut pour déplacer un curseur afin de cliquer au bon endroit.”

C’est essentiellement un agent IA. C’est-à-dire, une IA qui peut automatiser d’autres processus logiciels, que ce soit pour générer et qualifier des prospects marketing, découvrir des motifs et des tendances dans des données médicales, ou simplement naviguer vers un site Web spécifique et remplir un formulaire dont vous avez besoin. Pensez à eux comme à une version plus avancée des systèmes existants d’Automatisation des Processus Robotisés.

L’entreprise cite Asana, Canva, Cognition, DoorDash, Replit et The Browser Company comme des adopteurs précoces de la nouvelle fonctionnalité. Par exemple, Replit utilise le Contrôle de l’Ordinateur pour “développer une fonctionnalité clé qui évalue les applications au fur et à mesure de leur conception pour leur produit Replit Agent,” selon l’annonce.

Il n’y a pas lieu de s’inquiéter que l’IA prenne le contrôle (pour l’instant), comme l’explique Anthropic. “Les humains restent aux commandes en fournissant des invites spécifiques qui dirigent les actions de Claude, comme ‘utiliser les données de mon ordinateur et en ligne pour remplir ce formulaire,’” a déclaré un porte-parole d’Anthropic à TechCrunch. “Les personnes permettent et limitent l’accès selon leurs besoins. Claude décompose les invites de l’utilisateur en commandes informatiques (par exemple, déplacer le curseur, cliquer, taper) pour accomplir cette tâche spécifique.”

Anthropic accepte également que le Contrôle de l’Ordinateur puisse être détourné pour générer du spam, diffuser de la désinformation ou commettre des fraudes. En réponse, l’entreprise a développé de nouveaux classificateurs pour identifier lorsque l’API est utilisée et si cette utilisation “cause du tort.”