Cell重磅 “抗体 GPT”:你只需要知道抗原序列,就可得到抗体
该研究介绍了一种名为MAGE的模型,它能够基于抗原序列直接生成具有真实结合能力的人源抗体。MAGE基于预训练的Progen2自回归模型进行微调,并使用包含18,506对抗体-抗原序列的训练集进行训练。通过将抗原序列与重链、轻链可变区拼接为连续序列,MAGE在训练过程中同时感知三者之间的统计关联。研究者以SARS-CoV-2 RBD为例,展示了MAGE一次性生成上千条抗体候选的能力,经过筛选后,大多数序列被认为在生物学上是合理的。这一方法有望大幅简化抗体药物发现流程,尤其在应对新发病原体时更具优势。尽管当前数据集偏向冠状病毒抗体,但作者认为这为评估模型泛化能力提供了重要背景。