
Dans une démarche décisive qui souligne l'intégration accélérée de l'intelligence artificielle (IA [Artificial Intelligence]) dans la chaîne de valeur pharmaceutique, Merck (connu sous le nom de MSD en dehors des États-Unis et du Canada) et la Mayo Clinic ont annoncé une collaboration stratégique en recherche et développement. Dévoilé le 18 février 2026, ce partenariat représente un tournant majeur par rapport aux modèles traditionnels de découverte de médicaments, visant à exploiter d'imposants ensembles de données cliniques multimodales pour alimenter des algorithmes d'IA de nouvelle génération.
La collaboration marque la première alliance de cette ampleur de la Mayo Clinic avec une entreprise biopharmaceutique mondiale, signalant un changement dans la manière dont les systèmes de santé monétisent et utilisent leurs actifs de données pour une avancée scientifique plus large. En intégrant les technologies de « cellule virtuelle » assistées par l'IA de Merck à l'architecture robuste de la Mayo Clinic Platform, les deux entités visent à contourner les limites de l'identification conventionnelle des cibles. L'initiative se concentrera initialement sur trois domaines thérapeutiques à besoins élevés : les maladies inflammatoires de l'intestin (MII [IBD]), la dermatite atopique et la sclérose en plaques, avec l'espoir de démêler les fondements biologiques complexes de ces affections grâce à des analyses avancées.
Pour les observateurs du secteur, ce partenariat n'est pas seulement un accord de partage de données, mais une évolution structurelle de la médecine de précision (precision medicine). Il met en lumière une tendance croissante où le « laboratoire » est de plus en plus virtualisé, et où la probabilité de succès clinique est calculée bien avant qu'une molécule n'entre dans une éprouvette.
Au cœur de cette collaboration se trouve le déploiement du programme Mayo Clinic Platform_Orchestrate. Contrairement aux accords de licence de données standard, qui impliquent souvent des transferts statiques de dossiers anonymisés, le programme Orchestrate offre un environnement dynamique et sécurisé pour le co-développement. Cette architecture permet à Merck d'accéder au vaste répertoire d'informations cliniques de la Mayo Clinic sans que les données ne quittent jamais l'environnement cloud sécurisé, répondant ainsi aux préoccupations de confidentialité tout en maximisant l'utilité informatique.
La plateforme se distingue par la profondeur et la variété exceptionnelles de ses données. Elle va au-delà des simples dossiers de santé électroniques (DSE [EHR]) pour englober un paysage « multimodal ». Cela inclut des notes cliniques non structurées, de l'imagerie radiologique, du séquençage génomique et des résultats de laboratoire. Lorsqu'elles sont injectées dans des modèles d'apprentissage automatique (machine learning), cette riche mosaïque de données permet aux chercheurs de construire des profils d'évolution de la maladie plus complets qu'auparavant.
L'intégration de données multimodales est le pivot de cette stratégie. Dans la découverte traditionnelle, un chercheur pourrait examiner un marqueur génétique de manière isolée. Sous ce nouveau cadre, un modèle d'IA peut analyser simultanément les marqueurs génétiques d'un patient, les changements structurels visibles dans ses examens IRM et la progression longitudinale enregistrée dans les notes cliniques.
Cette vision holistique est essentielle pour l'entraînement des modèles de « cellule virtuelle » — des jumeaux numériques des processus biologiques cellulaires que Merck développe. Ces modèles simulent la réaction des cellules à divers stimuli et états pathologiques, permettant aux scientifiques de tester la résistance (stress test) des cibles médicamenteuses potentielles in silico. En validant ces modèles virtuels par rapport aux données cliniques du monde réel de la Mayo Clinic, Merck vise à réduire considérablement le taux de faux positifs lors de la phase de découverte précoce, garantissant que seuls les candidats les plus prometteurs progressent vers les essais physiques.
La collaboration a clairement défini son champ d'action initial, ciblant trois affections chroniques qui ont historiquement mis au défi les développeurs de médicaments en raison de leur hétérogénéité.
Domaines d'intervention thérapeutiques :
En se concentrant sur ces domaines, Merck et la Mayo Clinic appliquent leurs capacités d'IA à des maladies où les « blockbusters » universels n'ont pas réussi à répondre aux besoins de tous les patients. L'objectif est d'identifier des sous-populations et des biomarqueurs spécifiques pouvant mener à des thérapies sur mesure — l'essence même de la médecine de précision.
Pour comprendre les mécanismes de ce partenariat, il est utile de décomposer les composants spécifiques que chaque entité apporte et la valeur stratégique dérivée de leur intégration.
Tableau 1 : Composants clés de la collaboration Merck-Mayo
| Composant | Description | Avantage stratégique |
|---|---|---|
| Mayo Clinic Platform_Orchestrate | Une architecture de données distribuée et sécurisée permettant aux partenaires externes d'effectuer des calculs sur des données internes. | Permet un accès sécurisé à des données de haute valeur sans compromettre la confidentialité, accélérant l'entraînement des modèles. |
| Lac de données multimodales | Comprend la génomique, la pathologie, l'imagerie radiologique et les notes cliniques non structurées. | Permet la découverte de corrélations non évidentes entre le génotype et le phénotype. |
| Virtual Cell Technologies | Modèles d'IA exclusifs de Merck simulant la biologie cellulaire et les voies de la maladie. | Réduit la dépendance aux modèles animaux et aux expériences en laboratoire humide pour le criblage initial des cibles. |
| Expertise clinique | Accès direct aux cliniciens et chercheurs de la Mayo Clinic pour la validation du contexte. | Garantit que les informations générées par l'IA sont cliniquement pertinentes et biologiquement plausibles. |
Ce partenariat illustre une approche de « pensée plateforme » (Platform Thinking) relativement nouvelle dans le secteur de la santé. Maneesh Goyal, directeur de l'exploitation (COO) de la Mayo Clinic Platform, a noté que si d'autres secteurs ont adopté les ressources partagées et les modèles collaboratifs, la santé a historiquement été cloisonnée par des contraintes propriétaires. Cet accord brise ce moule en créant un écosystème modulaire où les données et les algorithmes interagissent de manière fluide.
Pour Merck, les implications s'étendent au-delà des trois domaines pathologiques initiaux. Robert M. Davis, président-directeur général de Merck, a souligné que l'intégration de données cliniques de haute qualité est essentielle pour améliorer la « probabilité de succès » de leurs programmes. Dans le monde à enjeux élevés de la R&D pharmaceutique, où le coût de mise sur le marché d'un médicament dépasse les 2 milliards de dollars et prend plus d'une décennie, même une amélioration marginale de la précision prédictive au stade de l'identification des cibles peut se traduire par des milliards d'économies et des années de temps de développement gagnées.
De plus, cette collaboration crée un précédent sur la manière dont les « données du monde réel » (données du monde réel [Real-World Data - RWD]) sont utilisées. Elle fait passer l'industrie au-delà de l'utilisation des RWD uniquement pour la surveillance post-commercialisation ou les soumissions réglementaires, les positionnant plutôt comme un moteur primaire pour la découverte en amont.
L'alliance Merck-Mayo est susceptible de déclencher un effet d'entraînement dans tout le secteur biopharmaceutique. Elle pousse les autres grands acteurs pharmaceutiques à sécuriser des « fossés de données » (data moats) similaires en s'associant à de grands centres médicaux universitaires. Nous entrons dans une ère où l'accès à des données de patients multimodales et organisées est aussi précieux que les bibliothèques chimiques que les entreprises pharmaceutiques ont mis des décennies à constituer.
Du point de vue de l'IA, cela renforce l'évolution vers les modèles de fondation (foundation models) en biologie. Tout comme les grands modèles de langage (LLM) nécessitent de vastes quantités de texte pour apprendre la syntaxe et la sémantique, les modèles de fondation biologiques nécessitent des ensembles de données vastes et diversifiés pour apprendre le « langage » de la maladie. Les données de la Mayo Clinic fournissent le volume et la complexité nécessaires pour entraîner ces modèles sophistiqués.
Cependant, des défis subsistent. Le succès de cette entreprise dépend de la qualité de l'intégration des données — le nettoyage et l'harmonisation des notes cliniques non structurées avec les données génomiques structurées constituent un défi d'ingénierie non négligeable. De plus, la traduction des prédictions de « cellule virtuelle » en thérapies humaines efficaces reste un obstacle scientifique que l'IA n'a pas encore totalement franchi.
À mesure que cette collaboration progresse, l'industrie observera de près si la promesse théorique de la médecine de précision pilotée par l'IA peut être convertie en actifs cliniques tangibles. En cas de succès, le modèle Merck-Mayo pourrait devenir la référence standard pour la découverte moderne de médicaments.