商务合作
动脉网APP
实验反馈驱动的生成模型优化显著提升生物序列设计成功率
2025-09-05 合成生物 等3家媒体报道 科研进展
该研究提出了一种基于似然的实验反馈整合方案,通过动态调整权重函数w(b)来优化生成模型,显著提升了生物序列设计的成功率。研究人员利用DCA模型对RNA和蛋白质序列进行设计,并结合Group I内含子核酶等实验验证,将功能性序列生成率从6.7%提升至63.7%。这一成果为克服进化数据局限性、实现精准生物分子设计提供了新范式。传统生成模型依赖多重序列比对(MSA)数据训练,但自然进化数据存在功能序列采样稀疏性和实验室条件与生物体原生环境差异的问题,导致假阳性率高。研究团队开发了基于似然的反馈整合框架,通过构建动态权重函数并调节强度参数λ,重新校准模型参数,使生成序列向功能区域集中。关键技术方法包括直接耦合分析(DCA)、RNAeval计算RNA折叠自由能、高通量自剪接实验、主成分分析(PCA)可视化序列空间分布演变以及两种反馈整合策略。实验数据来源于Rfam数据库的tRNA、核糖开关等RNA家族及chorismate mutase(CM)蛋白质家族。该研究创新性地将实验数据转化为修正频率?f,通过迭代优化DCA参数,提升了模型的设计准确性。(摘要由动脉网AI生成)