Améliorer les résultats de la découverte de médicaments grâce aux cellules virtuelles de Recursion
Lire le journalIntroduction
La quête pour déchiffrer la biologie est l’un des défis les plus durables et les plus essentiels de l’humanité. La découverte traditionnelle de médicaments, un processus fastidieux qui s’étend souvent sur plus d’une décennie et coûte des milliards, continue de subir un taux d’échec élevé en clinique. Nous pensons qu’un changement fondamental est nécessaire pour changer ce paradigme, un changement qui conduit vers une compréhension plus complète, prédictive et mécanistique de la biologie.
Et si nous pouvions construire des modèles computationnels qui non seulement prédisent les réponses cellulaires aux interventions, mais expliquent aussi pourquoi ces réponses se produisent ? Et si ces « cellules virtuelles » pouvaient nous aider à naviguer dans l’immense complexité de la biologie pour découvrir et développer de nouveaux médicaments de manière plus efficiente et efficace?
Chez Valence Labs, le moteur de recherche en IA de Recursion, nous explorons cette frontière. Nous pensons que le moment est venu de concevoir les bases de ces cellules virtuelles. Dans notre article de perspective, “Cellules virtuelles : Predict, Explain, Discover,” nous partageons notre réflexion sur le développement et la validation de ces systèmes.
Les piliers fondamentaux de Recursion permettent la poursuite de la cellule virtuelle
La réalisation de cette vision est possible grâce aux capacités uniques de Recursion:
- Données interventionnelles à l’échelle industrielle: La construction et la validation de cellules virtuelles nécessitent des données biologiques d'une ampleur et d'une diversité sans précédent. Recursion a consacré plus d’une décennie à la création de l’un des ensembles de données biologiques et chimiques propriétaires les plus importants et les plus pertinents au monde, dépassant désormais 65 pétaoctets. Ces données dynamiques et interventionnelles couvrent la phénomique, l'invivomique, les données au niveau des patients et bien plus encore. Avec jusqu'à 2,2 millions d'expériences exécutées chaque semaine par les laboratoires automatisés de Recursion automated labsces ensembles de données continuent de s'étendre.
- IA et apprentissage automatique pionniers pour la biologie: Les techniques modernes d'IA/ML alimentent les cellules virtuelles. Nous nous concentrons sur le développement et l'application d'approches de ML adaptées à la complexité de la biologie et de la découverte de médicaments, en nous appuyant sur une solide expérience qui comprend la recherche fondamentale, les modèles “open source”et les applications concrètes..
- Infrastructure spécialement conçue de supercalcul: L’ampleur des données biologiques et la complexité des modèles d’IA nécessitent une capacité de calcul importante. BioHive-2de Recursion, le superordinateur le plus puissant en biopharmaceutique, fournit l’infrastructure essentielle pour entraîner des modèles de pointe et explorer les frontières de la simulation biologique.
- Synergie de l'automatisation et de l'IA: L’intégration étroite entre l’automatisation avancée des laboratoires de Recursion et le développement de modèles d’IA de Valence Labs crée crée de puissantes boucles de rétroaction, permettant des cycles rapides de génération d'hypothèses, de validation expérimentale et d'affinement des modèles.
Préparer le terrain : TxPert comme première étape de notre plan directeur
Avec Recursion, nous prenons des mesures concrètes et itératives pour renforcer nos fondations sur la voie des cellules virtuelles. Aujourd'hui, parallèlement à notre article de perspective, nous présentons TxPert, un modèle de pointe capable de prédire les réponses transcriptionnelles à des perturbations génétiques combinatoires. Conçu pour être robuste dans des scénarios hors distribution, il prédit les effets de knockdowns génétiques inédits, de combinaisons de perturbations ou de réponses dans de nouveaux contextes cellulaires.

Prédire avec précision ces réponses est essentiel pour hiérarchiser les hypothèses en découverte de médicaments, où les tests expérimentaux de toutes les possibilités ne sont ni scalable ni économiques. TxPert atteint des performances élevées en exploitant lesréseaux de connaissances biologiques et des architectures basées sur les graphes pour capturer des effets spécifiques au contexte et généraliser au-delà des données d’entraînement.

TxPert aborde la capacité de “Prédiction” de notre cadre de travail. Il représente une première étape dans notre voyage vers la cellule virtuelle, et le cadre d’analyse comparative qu’il introduit illustre notre engagement à construire des modèles éclairés par la complexité biologique et guidés par les résultats réels de la découverte de médicaments.
Le moteur de la découverte: des systèmes agentiques
La cellule virtuelle est un système dynamique en perpétuel apprentissage. Comme détaillé dans notre article, nous envisageons un paradigme du « laboratoire dans la boucle » où les cellules virtuelles sont affinées de manière itérative. Conceptuellement, une cellule virtuelle peut être considérée comme une théorie de la physiologie et de la pathologie cellulaires humaines qui génère des hypothèses sur les systèmes biologiques, observables à travers des expériences.
Les agents peuvent ensuite utiliser ces hypothèses pour concevoir et exécuter des expériences en laboratoire, cherchant explicitement à falsifier la « théorie » actuelle de la cellule virtuelle. Une expérience qui prouve qu'une prédiction est erronée devient une opportunité d'apprentissage cruciale. Cela permet d’affiner le modèle, le rendant plus précis et plus robuste. En recherchant activement des expériences qui falsifient la cellule virtuelle actuelle, nous pouvons découvrir une nouvelle biologie et accélérer la découverte thérapeutique.
Ce cycle – prédire, tester (falsifier), affiner – crée un puissant moteur de découverte. Dans le contexte de la découverte de médicaments, cela représente un passage du paradigme plus lent «concevoir-fabriquer-tester-mesurer» à une approche plus rapide «concevoir-simuler-tester-apprendre» ou «concevoir-simuler», ouvrant la voie à de nouvelles opportunités thérapeutiques.
L’exploration de la manière dont les systèmes agentiques peuvent accélérer ce cycle est un objectif clé. Nous développons activement des systèmes capables non seulement de générer conditionnellement des hypothèses à l'aide de cellules virtuelles, mais également de prioriser les hypothèses à falsifier, de concevoir des expériences pour tester efficacement ces hypothèses, d'orchestrer l'exécution des expériences, d'analyser les résultats expérimentaux et de les intégrer dans la cellule virtuelle pour un raffinement itératif. Les travaux de Recursion sur le moteur de flux de travail orchestré (LOWE [LLM orchestrated workflow engine]) illustrent ce potentiel.LOWE) illustrates this potential.
Relier les échelles biologiques: Des mécanismes moléculaires à la fonction cellulaire
Une cellule virtuelle doit également combler le fossé entre le monde moléculaire et les phénomènes cellulaires. Bien que la simulation de cellules entières à partir des premiers principes ne soit pas encore réalisable, nous visons une intégration à toutes les échelles. Cela implique de tirer parti de simulations ascendantes de haute fidélité pour les événements moléculaires clés, et de connecter ces modèles basés sur la physique avec des données fonctionnelles issues des expériences cellulaires à grande échelle de Recursion.
Nos recherches comprennent l'exploration de techniques avancées de modélisation moléculaire, y compris des domaines liés à la compréhension des propriétés chimiques dérivées du quantique (c'est-à-dire OpenQDC), afin d'insuffler à nos modèles avec une compréhension mécaniste plus approfondie.
Une voie à suivre: Analyse rigoureuse et progrès collaboratifs
Des progrès tangibles dans le développement de cellules virtuelles dépendent de l’établissement et de l’adoption de critères de référence robustes et fondés sur la biologie. L’évaluation standardisée est essentielle pour garantir que les nouvelles méthodes améliorent les capacités prédictives et explicatives.
Les initiatives favorisant des plateformes d’évaluation ouvertes, comme Polaris, et le partage de jeux de données de haute qualité, tels que RxRx3-core, sont des étapes cruciales pour établir ces normes élevées et encourager des avancées transparentes dans tout le domaine.
Notre objectif ultime est de contribuer à un avenir où la découverte de médicaments est considérablement accélérée et où la probabilité de succès sera considérablement accélérée et où la probabilité de succès est considérablement augmentée pour les thérapies répondant aux besoins critiques des patients. La voie vers les cellules virtuelles et, à terme, les tissus virtuels, les organes et même les modèles spécifiques aux patients est ambitieuse, mais elle ouvre la voie vers une nouvelle ère de médecine de précision.

Nous sommes enthousiastes de partager notre perspective et nos travaux en cours, et nous invitons l’ensemble de la communauté scientifique à s’engager avec ces idées, à les remettre en question et à s'en inspirer alors que nous travaillons collectivement vers un nouveau paradigme plus prévisible et plus puissant dans la découverte de nouveaux médicaments.
Nous vous encourageons à lire l'intégralité de notre article de perspective, “Cellules virtuelles : Predict, Explain, Discover,” pour approfondir la vision qui guide nos recherches chez Valence Labs.
