EN
登录

生物分子科学领域的大规模基础模型已可以通过NVIDIA BioNeMo平台获取

吴舒舒 2025-02-27 17:55

Evo 2 是一个强大的新型 AI 模型,它基于亚马逊云科技(AWS)上的 NVIDIA DGX Cloud 构建而成,能够帮助用户深入了解不同物种的 DNA、RNA 和蛋白质。


捕获.PNG


世界各地的科学家现在都可以访问 Evo 2,Evo 2 是一个功能强大的新型基础模型,能够理解所有生命领域的遗传密码。Evo 2 由非营利性生物医学研究机构 Arc 研究所和斯坦福大学联合在 NVIDIA DGX Cloud 平台上构建,是目前向公众开放的最大基因组数据 AI 模型。


Evo 2 在一个由近 9 万亿个核苷酸(DNA 和 RNA 的组成单位)组成的庞大数据集上训练而成,可用于生物分子研究应用,包括根据基因序列预测蛋白质的形态和功能、识别用于医疗和工业应用的新型分子、以及评估基因突变如何影响这些分子的功能。


Arc 研究所联合创始人兼核心研究员、加州大学伯克利分校生物工程助理教授 Patrick Hsu 表示:“Evo 2 是基因组学的一座重要里程碑。通过增进对这些生命基本组成单位的了解,我们可以在医疗和环境科学领域探索目前难以想象的解决方案。”


借助适用于 Evo 2 的 NVIDIA NIM 微服务,用户能够生成各种生物序列并通过设置调整模型参数。想要在其专有数据集上微调 Evo 2 的开发者,可以通过开源 NVIDIA BioNeMo 框架(一个适用于生物分子研究的加速计算工具集)下载该模型。


斯坦福大学化学工程助理教授、迪特尔-施瓦茨基金会斯坦福数据科学系研究员、Arc 研究所创新研究员 Brian Hie 表示:“长期以来,设计新的生物学模型既费时费力,又充满不确定性。借助 Evo 2,研究人员能够更便捷地进行复杂生物系统的设计,取得突破的时间也大大缩短。”


助力复杂的科学研究


Arc 研究所创立于 2021年,创立之初,其创始捐赠者共出资 6.5 亿美元。该研究所为科学家提供多年期资助,使他们能够专注于创新研究而不必担心费用申请,以此助力研究人员攻克长期科学难题。


其核心研究人员可获得最先进的实验室场地,以及为期八年且可续签的资金支持。与此同时,研究人员还可以在该研究所的合作大学之一担任教职,这些合作大学包括斯坦福大学、加州大学伯克利分校和加州大学旧金山分校。


凭借顶尖的研究环境以及 NVIDIA 的加速计算专业技术和资源,Arc 研究所的研究人员能够开展更加复杂的项目,分析更庞大的数据集并更快取得成果。该研究所的科学家正致力于癌症、免疫功能障碍、神经变性等疾病领域的研究。


NVIDIA 通过 AWS 上的 NVIDIA DGX Cloud 向科学家提供了 2000 颗 NVIDIA GPU,加速了 Evo 2 项目的落地。DGX Cloud 开通了对大型计算集群的短期访问路径,使研究人员能够灵活开展创新。这个全托管式 AI 平台包含 NVIDIA BioNeMo,以 NVIDIA NIM 微服务和 NVIDIA BioNeMo Blueprint 的形式提供各种优化软件。


NVIDIA 研究人员和工程师还在 AI 扩展和优化方面开展了密切合作。


在生物分子科学领域的应用


Evo 2 能够深入分析 DNA、RNA 和蛋白质。该模型基于植物、动物和细菌等生命领域的众多物种数据训练而成,可应用于医疗、农业生物技术、材料科学等科学领域。


Evo 2 所使用的新型模型架构可处理冗长的遗传信息序列,最多可达到 100 万个 token。这种对基因组更全面的观察视角,能够帮助科学家们深入理解生物体遗传密码中相距较远部分之间的联系,以及细胞功能、基因表达和疾病的机制。


Hsu 表示:“一个人类基因就包含数千个核苷酸,所以要让 AI 模型分析如此复杂的生物系统如何运作,每次能够处理的基因序列信息越多越好。”


在医疗和药物研发领域,Evo 2 可以帮助研究人员了解哪些基因变异与特定疾病有关,并设计出能够精准靶向这些区域治疗疾病的新型分子。例如斯坦福大学和 Arc 研究所的研究人员发现,在 BRCA1(一种与乳腺癌有关的基因)检测中,Evo 2 能够预测以前未识别的突变是否会影响基因功能,并且准确率能达到 90%。


在农业领域,该模型可深入解析植物生物学,并帮助科学家开发出更能抵御气候变化或营养更丰富的农作物品种,以此助力解决全球粮食短缺问题。在其他科学领域,Evo 2 可用于设计生物燃料,或者改造能分解石油或塑料的蛋白质。


Arc 研究所首席技术官 Dave Burke 表示:“部署像 Evo 2 这样的模型,就如同将一台功能强大的新型望远镜送往宇宙最遥远的地方。虽然我们知道前方有无数的奥秘等待着我们去探索,但我们不知道会发现什么。”


在 NVIDIA 技术博客 和 Arc 研究所的技术报告中阅读有关 Evo 2 的更多信息。


NVIDIA 技术博客:

https://developer.nvidia.com/blog/understanding-the-language-of-lifes-biomolecules-across-evolution-at-a-new-scale-with-evo-2/


Arc 研究所的技术报告:

https://arcinstitute.org/manuscripts/Evo2


阅读有关软件产品信息的通告:

https://www.nvidia.cn/about-nvidia/terms-of-service/

吴舒舒

共发表文章53篇

最近内容
查看更多
  • GTC25 | NVIDIA与GE医疗合作,通过引入物理AI推进自主诊断成像开发

    2025-03-20

  • 生物分子科学领域的大规模基础模型已可以通过NVIDIA BioNeMo平台获取

    2025-02-27

  • AI设计的蛋白质对抗致命蛇毒

    2025-02-19