Microsoft affirme avoir développé un outil d’IA plus performant que les médecins humains

Microsoft affirme avoir développé un outil d'IA plus performant que les médecins humains

Une avancée majeure dans le domaine médical fait surface avec un outil d’intelligence artificielle, promettant des résultats supérieurs aux diagnostics humains. Les implications de cette technique pourraient transformer la manière dont les soins sont dispensés, en améliorant l’efficacité des diagnostics dans la santé.

Microsoft a développé un outil médical basé sur l’IA, affirmant qu’il surpasse les médecins humains de quatre fois en matière de diagnostic de maladies complexes.

Robots contrôlés par RV pour servir en première ligne

Lors d’une interview avec le Financial Times, le PDG de Microsoft AI a indiqué que cette avancée représente un pas vers l’intelligence médicale supérieure, capable de résoudre les problématiques de personnel et de réduire les temps d’attente dans les systèmes de santé saturés.

Intitulé Microsoft AI Diagnostic Orchestrator (MAI-DxO), ce nouveau système repose sur un « orchestrateur » qui crée des tableaux virtuels avec cinq agents d’IA jouant des rôles de « médecins ». Chacun a une fonction particulière, comme formuler des hypothèses ou sélectionner des examens diagnostiques. Ces agents interagissent et débattent ensemble pour élaborer une stratégie d’action.

1751378476 940 Microsoft affirme avoir developpe un outil dIA plus performant que

Pour évaluer ses performances, le système a traité 304 études publiées dans le New England Journal of Medicine, considérées comme des cas parmi les plus compliqués résolus par des médecins.

Cela a permis aux chercheurs de vérifier si le système pouvait parvenir au bon diagnostic tout en expliquant son processus de prise de décision grâce à une nouvelle technique nommée « chaîne de débat ». Cette méthode oblige les modèles de raisonnement de l’IA à fournir une explication détaillée de la résolution du problème.

Pour cela, Microsoft a utilisé des modèles de langage avancés, tels que ceux développés par OpenAI, Meta, Anthropic, Google, xAI et DeepSeek, en les programmant pour être efficaces.

85,5% de réussite contre 20%

Comme rapporté, le MAI-DxO a, pour tous les LLM, amélioré les performances, mais a particulièrement excellé avec le modèle de raisonnement o3 de OpenAI, résolvant correctement 85,5% des cas présentés. En comparaison, des médecins expérimentés ont atteint un taux de réussite d’environ 20%. Il est important de noter qu’ils n’avaient pas accès à des livres ni possibilité de consulter des collègues, ce qui aurait pu augmenter leur taux de succès.

Youtube video

Selon le co-fondateur de DeepMind, Mustafa Suleyman, Microsoft s’approche de modèles d’IA non seulement plus performants, mais radicalement supérieurs à la performance humaine : plus rapides, moins coûteux et quatre fois plus précis.

Dominic King, ancien responsable de l’unité de santé de DeepMind, qui a rejoint Microsoft récemment, estime que ce projet excède ce qui a été observé auparavant, présentant une opportunité d’agir comme une nouvelle voie d’accès aux soins de santé.

Prochainement, cette technologie pourrait également être intégrée au chatbot Copilot AI de Microsoft et au moteur de recherche Bing, qui traitent chaque jour 50 millions de consultations liées à la santé.

Le Microsoft AI Diagnostic Orchestrator constitue la première initiative de la branche santé d’IA de l’entreprise, dirigée par Suleyman, avec des équipes issues de DeepMind.