Une nouvelle intelligence artificielle, nommée DARWIN (Deep-learning Augmented Recognition of Water-mediated Interactions and Networks), bouleverse le monde de la biologie structurale. Développée par une équipe de chercheurs du laboratoire de biologie computationnelle de l'Université de Cambridge, cette IA est capable de prédire les structures tridimensionnelles des protéines avec une précision inégalée, dépassant les performances d'AlphaFold, le célèbre outil de DeepMind.
Une révolution dans la prédiction des structures protéiques
Les protéines, ces macromolécules essentielles à la vie, adoptent des formes complexes qui déterminent leur fonction. Comprendre leur structure 3D est crucial pour développer des médicaments, mais les méthodes expérimentales comme la cristallographie aux rayons X sont lentes et coûteuses. DARWIN, en s'appuyant sur un apprentissage profond et une modélisation des interactions avec l'eau, atteint un taux de précision de 95 % dans la prédiction des structures, selon l'article publié dans Nature Methods le 22 juin 2026.
Comment DARWIN surpasse AlphaFold
Contrairement à AlphaFold, qui se concentre sur les interactions entre acides aminés, DARWIN intègre le rôle crucial des molécules d'eau dans le repliement des protéines. Les chercheurs ont entraîné leur modèle sur un ensemble de données comprenant plus de 50 000 structures protéiques résolues expérimentalement, ainsi que des simulations de dynamique moléculaire. « DARWIN capture des détails que les autres modèles ignorent, notamment les ponts hydrogène médiés par l'eau, qui sont essentiels pour la stabilité des protéines », explique le Dr. Elena Vásquez, auteure principale de l'étude.
Des applications thérapeutiques prometteuses
Les implications de cette avancée sont immenses. En permettant de prédire rapidement et précisément la structure de protéines jusqu'alors non résolues, DARWIN accélère la découverte de cibles médicamenteuses. Par exemple, l'IA a déjà permis d'identifier une poche de liaison inconnue dans la protéine KRAS, une cible majeure dans le cancer du poumon. « Cela ouvre la voie à des inhibiteurs plus efficaces, avec moins d'effets secondaires », ajoute le Dr. Vásquez.
Un outil open source pour la communauté scientifique
Les code source et les poids du modèle DARWIN sont disponibles en accès libre sur GitHub, ce qui permet à d'autres laboratoires de l'utiliser et de l'améliorer. Déjà, des équipes de l'Institut Pasteur et du MIT ont commencé à l'adapter pour étudier les protéines membranaires et les virus. « Nous espérons que DARWIN deviendra un outil standard, au même titre que BLAST ou PyMOL », déclare le professeur John Smith, co-directeur du laboratoire.
Une précision validée par des expériences
Pour valider leurs prédictions, les chercheurs ont collaboré avec des biologistes structuraux qui ont déterminé expérimentalement plusieurs structures prédites par DARWIN. Dans 97 % des cas, les prédictions correspondaient aux structures réelles, avec une déviation RMSD inférieure à 1 ångström. Ce résultat dépasse les 90 % d'AlphaFold sur les mêmes protéines.
Des défis à relever
Malgré ces succès, DARWIN n'est pas parfait. L'IA a plus de difficultés avec les protéines intrinsèquement désordonnées, qui n'ont pas de structure fixe. « Nous travaillons sur une version améliorée qui prendra en compte la flexibilité des protéines », précise le Dr. Vásquez. De plus, la puissance de calcul nécessaire reste élevée, bien que l'équipe ait optimisé le modèle pour fonctionner sur des GPU grand public.
Un impact sur la recherche fondamentale
Au-delà des applications médicales, DARWIN permet de mieux comprendre les mécanismes fondamentaux du repliement des protéines. Les chercheurs ont déjà utilisé l'IA pour étudier comment les mutations ponctuelles affectent la structure, ce qui pourrait éclairer les maladies génétiques. « C'est un outil puissant pour la biologie des systèmes », conclut le professeur Smith.



