EN
登录

AI虚拟细胞:解码生命复杂性的革命性突破

王新凯 2025-11-11 18:00

一个人类细胞内部游弋着数万亿个分子,包括约4200万个蛋白质,以及大量的碳水化合物、脂质和核酸。细胞器和其他结构拥挤其中,其复杂程度远超人类所创造的任何宏伟建筑。细胞质如同一个疯狂的化学实验室,各类分子持续反应、重组和重塑,数千个基因不断开启和关闭,将看似混乱的状态转化为协调一致的行动。


这种复杂性超出了人类心智目前能够完全理解或预测的范围。因此,许多研究人员认为,人工智能(AI)凭借其强大的信息吸收和处理能力,或许能够胜任这项任务。ChatGPT在近3年前的惊艳亮相,激发了虚拟细胞构建者的灵感。"人们希望生物学也能迎来这样的时刻,"艾伦研究所的AI研究科学家Kasia Kedzierska说。


AI虚拟细胞如果能够成功模拟其活体对应物,将为多个研究领域带来变革性价值:在制药实验室快速评估大量潜在药物,作为工程细胞的测试平台,帮助医生选择个性化药物,甚至构建虚拟组织和器官以解决诸如肿瘤环境如何影响其生长等复杂问题。


1.png

(来源:Science)


陈-扎克伯格倡议(CZI)科学AI负责人Theofanis Karaletsos认为,AI驱动的细胞模拟"创建了一个整合的知识图谱",能够帮助研究人员理解涌入分子数据库的大量多样化信息。


AI重塑细胞模拟:从方程到数据的范式转变


虚拟细胞模型的探索始于约25年前,研究人员最初使用依赖大量方程的计算方法来重现代谢、蛋白质合成等细胞过程。2012年,斯坦福大学的研究团队公布了首个全细胞模型——生殖支原体的硅基版本。


然而,这些传统模型存在明显局限,慕尼黑工业大学的计算生物学家Fabian Theis指出,它们只能遵循开发者设定的生物学规则,"在做出某些预测方面完全失败了",比如预测沉默基因的影响。


正是这些局限性推动了AI驱动模型的发展。与固定方程不同,AI模型从大量实验数据中自主学习细胞的操作原理。


斯坦福大学生物物理学家Steve Quake在谈到他和CZI同事开发的AI模型TranscriptFormer时说:"我们不教它任何生物学。"这标志着细胞模拟从方程驱动向数据驱动的范式转变。


如今的AI虚拟细胞模型,通过真实实验中收集的大量细胞数据"自学"来理解细胞运作方式。就像ChatGPT能通过学习大量文本理解语言,这些AI模型能利用数千万甚至上亿个细胞的基因数据,学习并预测基因相互作用和细胞响应,比如CZI的CELLxGENE集合就包含了来自超过3500万个细胞的基因活性数据。这些AI细胞模型都是所谓的基础模型(foundation models),可以在不进一步训练的情况下探索广泛的细胞过程。Theis说:"一个模型统治一切是愿景。"


>>>>

Geneformer:验证AI预测的药物发现能力


格拉德斯通研究所的计算生物学家Christina Theodoris及其团队开发的Geneformer,用来自近3000万个人类细胞的基因活性数据训练,能够推断基因相互作用并预测干扰特定基因的效果。

 

更重要的是,团队将预测付诸实验验证。他们使用CRISPR在心肌细胞中禁用模型预测的基因,发现关闭任一基因都增强了细胞的收缩强度,这表明抑制这些基因功能的药物可能帮助心肌病患者。Theodoris说:"Geneformer可以指出新方向并加速药物发现。"


>>>>

TranscriptFormer:跨物种零样本学习


斯坦福大学生物物理学家Steve Quake(现为Chan Zuckerberg Initiative科学副总裁)、Karaletsos及其同事开发的TranscriptFormer因其进化广度而脱颖而出。该模型在来自12个物种的1.12亿个细胞的基因活性数据上进行训练,不仅在分类罕见类型的人类细胞方面超过了scGPT和Geneformer,还可以分类训练集外物种的细胞,区分被SARS-CoV-2感染的肺细胞和健康细胞,并预测药物的细胞影响。


Karaletsos指出,该模型能够进行零样本学习(zero-shot learning),无需额外训练即可完成新任务,"展示了如何使用这样的工具来发现基础生物学。"


开启生物医学革命:虚拟细胞的无限可能


AI细胞模型正在逐步融入科学研究,展现出解码细胞复杂性的巨大潜力。哈佛大学计算生物学家Marinka Zitnik及其同事发布的600多个工具中,就包含了将细胞基础模型集成到AI科学家虚拟助手的能力。

 

>>>>

药物发现新范式:从预测到验证的闭环

 

在制药领域,AI虚拟细胞模型可以快速评估大量潜在药物,无需昂贵实验和漫长等待。Geneformer的成功案例证明,AI模型能够识别出可能对抗心脏疾病的分子,并通过实验验证其有效性,为药物发现带来了全新思路和更高效率。


>>>>

个性化医疗与精准治疗


虚拟细胞能够根据患者的分子特征进行定制,帮助医生选择最合适的个性化药物。通过分析患者的细胞数据,模型可以预测不同药物对特定患者细胞的影响,为临床决策提供科学依据。


>>>>

组织工程与再生医学

 

研究人员还可以将细胞模型编织成虚拟组织和器官,探索肿瘤环境如何影响其生长等复杂问题。这种从单细胞到组织、器官的建模能力,将极大推动组织工程和再生医学的发展。


>>>>

虚拟细胞挑战赛:加速技术迭代


为推动AI细胞模型发展,Arc研究所的计算生物学家Hani Goodarzi及其同事在今年6月发起了虚拟细胞挑战赛(Virtual Cell Challenge)。目前已有超过1000个团队报名参赛,竞争包括Nvidia等赞助商提供的10万美元现金和GPU使用时间。研究人员使用CRISPR在人类胚胎干细胞中一次关闭300个基因,参赛者需要预测基因沉默效果。这种大规模真实数据测试,将推动模型更贴近真实生物学场景。


未来展望:从"最笨的模型"到革命性工具


从2012年第一个全细胞模型诞生,到如今AI驱动的细胞基础模型涌现,虚拟细胞研究正在经历从方程驱动到数据驱动的范式转变。正如AlphaFold在蛋白质折叠问题上的成功——其两位开发者分享了2024年诺贝尔化学奖——虚拟细胞模型有望在药物发现、个性化医疗和基础生物学研究等领域带来革命性突破。


虽然当前模型仍面临技术挑战,但研究人员对AI在理解细胞复杂性方面的潜力保持乐观。


Kedzierska说:"我不会放弃这些模型。它们失败的地方为我们提供了很多重要信息。"


Karaletsos则认为,TranscriptFormer是"我们将构建的最笨的模型。"这句话既是对当前技术局限性的坦诚,也是对未来的乐观展望。


随着数据量增长、算法改进和评估体系完善,AI虚拟细胞模型必将进化为真正能够解码细胞复杂性的强大工具,为生物医学研究和临床应用带来前所未有的突破。

王新凯

共发表文章88篇

最近内容
查看更多
  • 一束星火,十年燎原|CCI十周年访谈

    2026-02-28

  • 上海交通大学蔡宇伽课题组诚聘博士后、副研究员

    2026-02-06

  • 5万元!中山大学孙逸仙纪念医院拟转让类风湿关节炎预测的相关专利

    2026-02-06