Microsoft a récemment levé le voile sur un projet d’intelligence artificielle qui pourrait bouleverser l’avenir du diagnostic médical. Baptisé MAI-DxO (Microsoft AI Diagnostic Orchestrator), ce système innovant revendique une capacité de diagnostic quatre fois supérieure à celle de médecins expérimentés, tout en réduisant les coûts associés aux examens. Une avancée technologique majeure qui soulève autant d’enthousiasme que d’interrogations dans le monde de la santé.
Contrairement aux outils traditionnels d’aide au diagnostic qui se contentent souvent de faire correspondre des symptômes à des maladies, MAI-DxO va beaucoup plus loin. Il simule le raisonnement clinique d’un praticien humain, en procédant étape par étape : anamnèse, formulation d’hypothèses, choix d’examens, puis diagnostic final. Ce processus repose sur une orchestration de plusieurs intelligences artificielles travaillant de concert, à l’image d’une équipe médicale multidisciplinaire confrontée à un cas complexe.
Chaque IA joue un rôle spécifique dans la chaîne de décision : certaines génèrent des hypothèses, d’autres suggèrent des examens complémentaires, et une IA "arbitre" tranche in fine. Ce mécanisme collaboratif, qualifié de "chaînage d’agents" par Mustafa Suleyman, responsable de Microsoft AI, est perçu comme une avancée vers ce que certains appellent déjà une superintelligence médicale.
Pour évaluer les performances de MAI-DxO, Microsoft s’est appuyé sur une base de 304 cas cliniques issus du prestigieux New England Journal of Medicine. À l’aide d’un protocole de test nommé Sequential Diagnosis Benchmark, l’IA a été confrontée à des scénarios médicaux complexes, en compétition avec plusieurs modèles (GPT-4, Claude 3, Gemini…) ainsi qu’un groupe de médecins expérimentés.
Résultat : MAI-DxO, en combinaison avec le modèle OpenAI o3, a réussi à établir le bon diagnostic dans 85,5 % des cas, contre seulement 20 % en moyenne pour les médecins humains. Et cela sans recourir à des examens superflus : le système sélectionne les tests les plus pertinents, optimisant ainsi le rapport efficacité-coût en réduisant jusqu’à 20 % les dépenses.
Malgré ses performances impressionnantes, MAI-DxO reste un outil expérimental. Les tests ont été réalisés dans un cadre contrôlé, sans interaction directe avec des patients réels. Microsoft envisage une intégration progressive, d’abord via des outils comme Bing (pour un usage grand public) ou sous forme d’assistant médical via Microsoft Copilot.
Mais pour franchir les portes des établissements de santé, il faudra bien plus : des études cliniques rigoureuses, des validations éthiques, et surtout la capacité à gérer l’imprévisibilité et la dimension humaine de la médecine. Car au-delà des chiffres et des protocoles, un diagnostic reste avant tout une interaction entre humains — une nuance que les IA devront encore apprendre à maîtriser.