本文由谷歌维尔利生命科学公司、英伟达与谷歌的研究团队合作完成,提出了一种创新的多模态电子病历基础模型,首次将多基因风险评分(PRS)作为核心数据模态整合进电子病历中。该研究利用了美国“我们所有人的研究计划”中的丰富临床与基因组数据,旨在探索临床数据与遗传倾向之间的复杂关系,推动个性化医疗的发展。研究提出了两种主要的模态整合架构:交叉注意力机制和适配器模块,基于GPT-2解码器架构进行扩展,支持自监督学习。数据来源包括约15万名参与者的数据,涵盖结构化电子病历、基因组数据和调查问卷等。PRS基于Pan-UKB联盟的全基因组关联研究计算得出,最终保留了3481个显著相关的PRS特征。这一创新方法通过路径计算概率,改进了传统蒙特卡洛采样方法的风险评估,提高了预测的准确性。