Le nouveau modèle d'IA d'OpenAI, Rosalind, pourrait réduire de plusieurs années la découverte de médicaments. Vous ne pourrez probablement pas l'utiliser

En bref

  • OpenAI a dévoilé GPT-Rosalind pour accélérer les flux de travail de découverte de médicaments.
  • Les benchmarks montrent des gains importants, mais l’impact réel reste limité .
  • L’accès est strictement restreint face à la montée des préoccupations de biosécurité.

OpenAI vient de nommer son premier modèle d’IA spécifique à un domaine d’après Rosalind Franklin — la chimiste britannique dont les travaux en cristallographie aux rayons X ont permis de révéler la double hélice de l’ADN, et qui a été célèbrement privée de crédit de son vivant. GPT-Rosalind, dévoilé jeudi, est un modèle de raisonnement conçu pour la biologie, la découverte de médicaments et la médecine translationnelle. C’est le premier d’une série que OpenAI appelle une série de modèles en sciences de la vie — une stratégie directe pour un marché où de nombreux laboratoires spécialisés, des universités à Google DeepMind, cherchent tous à prendre position. Selon des experts, il faut en moyenne 10 à 15 ans pour qu’un médicament passe de la découverte de la cible à l’approbation réglementaire aux États-Unis. La majorité de ce temps n’est pas consacrée à des moments d’eureka, mais à la routine : analyser des milliers d’articles, interroger des bases de données, concevoir des réactifs, interpréter des résultats ambigus. C’est ce que GPT-Rosalind essaie de traiter. OpenAI affirme que le modèle peut compresser ce travail précoce. Comme l’a dit la société, GPT-Rosalind est conçu pour aider les scientifiques à « explorer plus de possibilités, faire émerger des connexions qui pourraient autrement être manquées, et parvenir à de meilleures hypothèses plus rapidement ».

 Les benchmarks soutiennent au moins une partie de cette ambition. Sur BixBench — un benchmark basé sur des tâches bioinformatiques du monde réel — GPT-Rosalind a enregistré un taux de réussite de 0,751, le meilleur score parmi les modèles avec résultats publiés. Sur LABBench2, il a surpassé son prédécesseur GPT-5.4 sur six des onze tâches. GPT-Rosalind dépasse GPT 5.4 dans tous les cas impliquant les sciences de la vie, mais c’est un modèle très spécifique qui sera peu performant dans tout autre domaine.

OpenAI a également annoncé que Dyno Therapeutics aidera à tester et évaluer son modèle basé sur des séquences d’ARN non publiées pour exclure la mémorisation. Les dix meilleures soumissions de GPT-Rosalind se sont classées au-dessus du 95e percentile des experts humains sur des tâches de prédiction de séquences, et autour du 84e percentile en génération. Cela dit, la responsable de la recherche en sciences de la vie chez OpenAI, Joy Jiao, a été mesurée quant à ce que le modèle peut réellement faire. Elle a expliqué que l’entreprise ne voit pas Rosalind comme un modèle capable de créer de nouveaux traitements de manière autonome, mais a indiqué aux journalistes qu’il pourrait grandement accélérer la recherche. « Nous pensons qu’il y a une réelle opportunité d’aider les chercheurs à aller plus vite dans certaines des parties les plus complexes et chronophages du processus scientifique », a déclaré Jiao lors d’un briefing de presse, selon le LA Times. L’écosystème autour du modèle pourrait être aussi important que le modèle lui-même. OpenAI lance également un plugin de recherche en sciences de la vie gratuit pour Codex, connectant plus de 50 bases de données et outils scientifiques — recherches de structures protéiques, recherche de séquences, revue de littérature, pipelines génomiques. Les utilisateurs d’entreprise avec accès à GPT-Rosalind disposent de la couche de raisonnement en plus. Les autres reçoivent le plugin avec des modèles standard. OpenAI a aligné un panel de clients pharmaceutiques et biotechnologiques pour le lancement, notamment Amgen, Moderna et Thermo Fisher Scientific. Par ailleurs, il mène une collaboration de recherche avec le Laboratoire national de Los Alamos sur la conception assistée par IA de protéines et de catalyseurs. « Le domaine des sciences de la vie exige de la précision à chaque étape. Les questions sont très complexes, les données très uniques, et les enjeux extrêmement élevés », a déclaré Sean Bruich, vice-président senior d’Amgen en IA et données, dans l’annonce officielle. L’accès à Rosalind est délibérément restreint. Le modèle est réservé aux entreprises américaines, soumis à une qualification et à une revue de sécurité. La préoccupation n’est pas abstraite : une coalition internationale de plus de 100 scientifiques a déjà appelé à un contrôle plus strict des données biologiques utilisées pour entraîner l’IA, citant les risques liés à la conception de pathogènes. La mise en place restreinte d’OpenAI est une réponse directe. Pendant l’aperçu de la recherche, l’utilisation ne consommera pas de crédits API existants. Ce n’est pas non plus la première incursion d’OpenAI dans les flux de travail scientifiques. L’espace de travail de rédaction scientifique Prism lancé en janvier était une première étape. GPT-Rosalind est la version plus précise, plus spécialisée — et un signal que les modèles spécifiques à un domaine deviennent une véritable compétition. Aucun médicament découvert entièrement par IA n’a encore franchi la phase 3 des essais. Ce nombre reste zéro. Mais si GPT-Rosalind aide un chercheur à concevoir une meilleure expérience six mois plus tôt dans des milliers de laboratoires, alors l’effet cumulatif sur ce qui est découvert, et quand, pourrait changer la donne. C’est la véritable thèse ici, et il vaut la peine de suivre cela de près.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler