Les modèles IA Gen3 Claude 3.7 et Grok 3 révolutionnent le codage et les tâches complexes

La communauté de l’IA voit l’émergence de modèles de troisième génération tels que Claude 3.7 et Grok 3, qui révolutionnent les capacités de traitement et d’application de l’intelligence artificielle. Ces avancées significatives remettent en question l’approche traditionnelle de l’automatisation, invitant à repenser l’IA comme un véritable partenaire intellectuel.

La grande image : Ces derniers jours, la communauté de l’IA a été témoin de l’émergence d’une nouvelle génération de modèles d’IA, annonçant un bond significatif en termes de capacités et d’applications potentielles. Claude 3.7 et Grok 3 redéfinissent les limites de ce que l’IA peut accomplir, notamment dans les tâches complexes, les mathématiques et la programmation.

Ces modèles de Gen3 représentent un bond quantique dans la puissance de calcul utilisée lors de leur formation, selon un article écrit par Ethan Mollick dans la newsletter Substack One Useful Thing. Grok 3, développé par xAI d’Elon Musk, est le premier modèle connu à utiliser un ordre de grandeur de puissance de calcul supérieur à celui de son prédécesseur, GPT-4. Pour sa part, Claude 3.7 affiche des améliorations de performances substantielles et introduit de nouvelles capacités de raisonnement et de codage.

Les avancées de ces modèles reposent sur deux « lois de mise à l’échelle » tests identifiées par OpenAI. La première loi, illustrée sur le côté gauche du graphique, démontre que les modèles plus grands, entraînés avec plus de puissance de calcul, affichent des capacités améliorées. Cette relation n’est pas linéaire ; typiquement, une augmentation de puissance de calcul par un facteur de dix est nécessaire pour obtenir une amélioration linéaire des performances.

Crédit image : Ethan Mollick

La puissance de calcul impliquée dans la formation de ces nouveaux modèles est énorme. Les modèles Gen3 utilisent plus de 10^26 FLOPS pendant l’entraînement, ce qui équivaut à faire fonctionner un smartphone moderne pendant 634 000 ans ou à faire fonctionner l’ordinateur de guidage Apollo pendant 79 trillions d’années.

La seconde loi de mise à l’échelle, représentée sur le côté droit du graphique, révèle un phénomène intriguant : la performance de l’IA peut être améliorée en permettant au modèle plus de temps pour traiter les informations lors de la résolution de problèmes.

Cette découverte a conduit au développement de « Raisonneurs », des systèmes d’IA capables d’allouer des ressources informatiques supplémentaires pour résoudre des problèmes complexes plus efficacement, selon Mollick.

Ces avancées ne sont pas simplement académiques ; elles ont des implications profondes pour les applications du monde réel. Par exemple, Claude 3.7 a démontré la capacité de créer des visualisations interactives 3D de concepts académiques complexes et de générer du code fonctionnel à travers des conversations en langage naturel.

Dans un exemple, l’IA a produit un artefact interactif de machine à remonter le temps avec des graphismes pixelisés, démontrant sa capacité pour des tâches créatives et techniques.

Cependant, Mollick note que bien que ces systèmes soient impressionnants, ils ne sont pas infaillibles. Ils font encore des erreurs et présentent des limitations. Néanmoins, le rythme rapide de l’amélioration suggère que les capacités de l’IA continueront à s’élargir.

Alors qu’elles évoluent, ces intelligences remettent en question l’« état d’esprit d’automatisation » prédominant dans les environnements d’entreprise, qui considèrent souvent l’IA principalement comme un outil pour rationaliser les processus existants. Au lieu de cela, selon Mollick, ces nouveaux modèles invitent à repenser fondamentalement ce qui est possible, positionnant l’IA comme un partenaire intellectuel potentiel capable de s’attaquer à des tâches analytiques complexes, à des travaux créatifs et même à des problèmes de niveau recherche.

Ce changement nécessitera une nouvelle approche de l’intégration de l’IA dans les organisations. Les dirigeants devront aller au-delà de l’automatisation des tâches pour se concentrer sur l’augmentation des capacités, se demandant non seulement ce qui peut être automatisé, mais aussi quelles nouvelles capacités peuvent être débloquées.

Au fur et à mesure que ces modèles deviennent plus accessibles, Mollick encourage les individus et les organisations à explorer leurs capacités de manière pratique. À la fois Claude 3.7 et Grok 3 offrent des fonctionnalités et des forces uniques, Claude 3.7 fournissant des capacités d’exécution de code et Grok 3 proposant un ensemble plus large de possibilités, y compris des options de recherche approfondie.

Les modèles IA Gen3 Claude 3.7 et Grok 3 révolutionnent le codage et les tâches complexes

Offres JIMMY Prime Day : Grosses réduction sur les purificateurs d’eau et aspirateurs anti-acariens

Lymow One Plus : la tondeuse autonome aux doubles lames rotatives à -18% !

Jimmy : Aspirateurs anti-acariens indispensables en promo jusqu’au 26 juin !

Tu n’es pas fou, il y a une raison pour laquelle la batterie de ton téléphone tient moins longtemps en été

Tout ce que vous pouvez faire pour résoudre les problèmes de l’application Cita Sanitaria avant de vous décourager

Mole l’outil gratuit pour nettoyer optimiser et surveiller votre Mac

Photoshop, Lightroom et sept autres applications pour retoucher vos photos comme un pro

China réussit à récupérer sa fusée ! La suprématie spatiale de Elon Musk menacée

TEST UGREEN Maxidok 17 en 1 Thunderbolt 5 : Notre verdict sur la station d’accueil qui fait tout

TEST AFERIY P280 + Extension : Batterie de 4096Wh à 1439€, le meilleur rapport qualité-prix ?

TEST UGREEN Maxidok 10 en 1 Thunderbolt 5 pour Mac Mini : La station d’accueil parfaitement taillée ?