哈佛大学-麻省理工学院Broad研究所Fei Chen团队和麻省理工学院电气工程与计算机科学系Caroline Uhler团队在《Nature Methods》上发表了一种新的深度学习模型PUPS,该模型结合了蛋白质序列信息和细胞图像特征,用于精准预测蛋白质在不同细胞系及单细胞内的亚细胞定位。PUPS通过融合预训练的ESM-2蛋白质语言模型和卷积神经网络,能够提取蛋白序列特征和细胞标志物图像特征,从而实现对未见蛋白质和细胞类型的泛化预测,并揭示了蛋白质定位的生物学机制。实验验证显示,PUPS在Human Protein Atlas数据集上的预测误差显著低于随机基线,展示了其高度准确性和应用潜力。