尽管科学家已经鉴定出数千个与阿尔茨海默病(Alzheimer’s disease, AD)风险相关的基因变异,但解开这些变异如何导致疾病的机制仍然是一个巨大的挑战。根据世界卫生组织的数据,全球约有5500万人患有痴呆症,其中阿尔茨海默病是最常见的形式。
然而,绝大多数与疾病相关的遗传变异并不位于编码基因内部,而是隐藏在占据人类基因组98%的非编码区域,即所谓的“垃圾DNA”中。
2025年12月18日,新南威尔士大学(University of New South Wales)的Irina Voineagu教授团队在《自然-神经科学》(Nature Neuroscience)上发表了一项重要研究。

图:Irina Voineagu
(来源:UNSW Sydney)
研究团队利用CRISPRi技术和单细胞测序,在人类星形胶质细胞中功能性地测试了近1000个候选增强子,最终鉴定出约150个真正影响基因活性的“开关”,其中许多与阿尔茨海默病风险基因直接相关。
这一发现为理解非编码基因组在脑部疾病中的作用提供了关键的“线路图”。
在人类基因组的30亿个碱基对中,只有约2%的序列负责编码蛋白质,这些是我们熟知的基因。其余98%的序列长期以来被称为“垃圾DNA”(junk DNA),因为它们看似没有任何功能。
然而,随着ENCODE计划等大规模基因组学研究的推进,科学家们逐渐意识到,这部分庞大的非编码区域并非毫无用处的“废墟”,而是包含着复杂的调控指令,特别是增强子(enhancers)。增强子就像基因的远程开关,决定了基因在何时、何地以及以何种强度被激活。
这种调控机制在复杂疾病中尤为关键,因为全基因组关联分析(GWAS)显示,许多与疾病相关的遗传变异都位于这些非编码区域,而非基因本身。这就像是房间里的灯坏了,问题可能不在灯泡(基因)上,而在墙壁深处隐蔽的开关(增强子)及其连接线路出了故障。
在众多脑细胞类型中,星形胶质细胞(Astrocytes)是人脑中数量最丰富的胶质细胞。它们不仅仅是神经元的“后勤保障”,在调节突触功能、维持血腦屏障、控制血流以及参与神经炎症反应中发挥着核心作用。星形胶质细胞的状态变化,如反应性星形胶质细胞的产生,与阿尔茨海默病(AD)、帕金森病等神经退行性疾病的进展密切相关。
在AD患者的大脑中,星形胶质细胞的基因表达谱会发生显著改变,许多与疾病风险相关的基因在这些细胞中特异性表达。因此,解析星形胶质细胞中的基因调控网络,对于理解AD的病理机制至关重要。
然而,要在星形胶质细胞中精准定位并解析那些遥远且隐蔽的增强子并非易事。这主要归因于基因组的三维折叠结构——拓扑关联结构域(TADs)。增强子通常并不位于它们调控的基因附近,而是通过染色质环(loops)跨越数万甚至数十万个碱基对的长距离,与目标基因的启动子进行物理接触。这种“超距作用”使得仅仅依靠线性距离来推断具体的靶基因变得异常困难。

图:星形胶质细胞基因表达的调控回路
(来源:Nature Neuroscience)
例如,一个位于基因A附近的增强子,实际上可能是在调控远处基因B的表达,而跳过了基因A。传统的预测方法往往依赖于相关性分析,缺乏直接的功能性验证,导致我们对星形胶质细胞中基因调控网络的理解依然模糊不清。
为了突破这一瓶颈,研究人员必须超越单纯的序列分析,转而寻求一种能够直接测试这些DNA开关功能的方法。只有在真实的细胞环境中,逐一“拨动”这些开关,观察基因表达的变化,才能真正绘制出精准的调控图谱。这不仅是为了填补基础生物学的空白,更是为了在庞大的非编码基因组中寻找可能被药物靶向的全新位点,从而为阿尔茨海默病等神经退行性疾病的治疗开辟新的路径。
为了系统地解码星形胶质细胞中的增强子功能,Irina Voineagu教授团队设计了一项大规模的组合筛选实验。
他们首先基于开放染色质数据,锁定了979个在星形胶质细胞中活跃的候选增强子区域。为了验证这些候选区域的功能,研究人员采用了一种名为CRISPR干扰(CRISPR interference, CRISPRi)的前沿技术。与传统的CRISPR基因编辑不同,CRISPRi并不切割DNA,而是通过引导一种失活的Cas9蛋白(dCas9)与转录抑制域(KRAB)融合,结合到特定的DNA序列上,从而在物理上阻断转录因子的结合,精确地“关闭”目标增强子。
为了同时检测这近千个增强子的功能,研究团队将CRISPRi技术与单细胞RNA测序(scRNA-seq)相结合,分析了超过47,000个高质量的单细胞,在每一个单独的细胞中精确测量增强子被抑制后全基因组的基因表达变化。
实验结果令人瞩目,研究团队成功鉴定出了158个确定的调控相互作用,涉及145个功能性增强子和116个靶基因。数据显示,高达84.1%的增强子在被抑制后导致了靶基因表达的显著下调,证实了它们作为正向调节因子的核心作用。
更重要的是,这项研究揭示了增强子调控的一个关键特征:虽然大部分增强子倾向于调控距离最近的基因,但仍有29%的功能性增强子跳过了邻近的高表达基因,去调控更远的靶基因。这种复杂的跳跃式调控模式,解释了为什么仅仅依靠线性距离来推断致病位点的靶基因往往会出错。
在具体的疾病关联方面,研究团队发现许多被鉴定的增强子直接调控着与阿尔茨海默病病理密切相关的基因。
一个引人注目的例子是对LGALS3基因的调控。LGALS3编码的Galectin-3蛋白在神经退行性病变中调节小胶质细胞的激活。研究发现,LGALS3的表达受到三个特定的星形胶质细胞增强子的控制。值得注意的是,LGALS3不仅是星形胶质细胞和小胶质细胞相互作用的关键介质,还与AD最强的遗传风险因子APOE4存在相互作用——在携带APOE4等位基因的女性AD患者脑中,LGALS3的表达显著下调。这意味着,通过操控这些特定的增强子,可能精确调节LGALS3的水平,从而干预疾病进程。
此外,研究人员还发现增强子Enh427远程调控着CCL2基因的表达。CCL2编码是一种趋化因子,能够招募免疫细胞聚集在淀粉样斑块周围,从而加剧神经炎症。Enh427区域内包含多个与AD相关的遗传变异,进一步证实了这些非编码区域在疾病发病机制中的核心地位。
除了实验验证,该研究还利用产生的高质量数据集训练了一个名为EGrf的随机森林(Random Forest)机器学习模型。通过整合染色质状态(H3K27ac, H3K4me3, ATAC-seq)、基因稳定性指数以及增强子-基因距离等7个关键特征,EGrf模型在预测星形胶质细胞特异性的基因调控关系方面表现出了优异的性能,其准确率显著优于现有的基于癌症细胞系(如K562)训练的ABC模型和TAP-seq RF模型。

图:利用 EGrf 预测星形胶质细胞中增强子-基因调控相互作用
(来源:Nature Neuroscience)
利用这个新模型,研究团队在全基因组范围内进一步预测了超过1300个潜在的增强子-基因相互作用,极大地扩展了我们对星形胶质细胞基因调控景观的认知。为了验证模型的可靠性,研究人员挑选了5个预测与阿尔茨海默病风险基因相关的增强子进行单独验证,结果其中4个(80%)被成功证实,包括一个调控晚发性阿尔茨海默病主要风险基因CLU的增强子。
这项研究的意义不仅在于它是一次技术上的胜利,更在于它为理解和治疗脑部疾病提供了全新的视角和工具。
首先,它构建了目前为止最大规模的人类星形胶质细胞功能性增强子图谱。这个图谱就像一份详尽的电路图,清晰地标示出了哪些“隐秘开关”控制着关键的“灯泡”(疾病基因)。
对于阿尔茨海默病研究而言,这意味着我们将不再局限于研究那2%的编码基因,而是可以深入探索那片广阔且充满未知的98%非编码区域。
这些数据为填补“全基因组关联分析(GWAS)”与“致病机制”之间的鸿沟提供了关键桥梁。谷歌DeepMind团队已经在利用这一独特的数据集来基准测试他们最新的深度学习模型AlphaGenome,这进一步证明了该数据对于推动计算生物学和人工智能预测模型发展的核心价值。高质量的实验数据是训练下一代AI模型的基石,而EGrf模型的成功也表明,特定细胞类型的数据对于提高预测准确性至关重要。
其次,这一发现为精准医学带来了实质性的突破口。传统的药物开发往往针对蛋白质,但在某些情况下,直接调节基因的表达可能更为有效。特别是对于那些在多种细胞中都有表达但功能各异的基因,全身性的干预可能会带来严重的副作用。
研究中鉴定出的这类细胞特异性增强子,恰恰提供了一个完美的解决方案。由于许多增强子只在特定的细胞类型(如星形胶质细胞)中处于活跃状态,靶向这些增强子可以实现对特定细胞群体的精准调控,而不影响其他类型的脑细胞(如神经元)。
这就像是拥有了一把能够只关闭特定房间灯光的遥控器,而不会导致整栋大楼陷入黑暗。例如,针对LGALS3基因的干预,如果能通过特异性增强子在星形胶质细胞中进行,就可能在不干扰该基因在其他免疫细胞中正常功能的情况下,有效缓解神经炎症。
展望未来,这项研究开启了非编码基因组功能研究的新篇章。虽然目前距离临床应用尚有距离,但正如研究负责人Voineagu教授所指出的,针对镰状细胞贫血的首个获批基因编辑疗法正是靶向了细胞特异性的增强子(BCL11A增强子),这为基于增强子的疗法提供了强有力的先例。
此外,这项研究也存在一定的局限性,例如CRISPRi技术虽然避免了DNA切割带来的损伤,但可能无法完全模拟基因缺失的效果。未来的研究需要结合基因编辑(如CRISPR-Cas9)和碱基编辑技术,进一步验证特定单核苷酸变异(SNV)的功能后果。随着这类功能性图谱的不断完善,我们有理由相信,未来将出现能够精确修复或调节受损基因回路的创新疗法,从而从根源上纠正导致阿尔茨海默病等复杂神经疾病的分子异常。
这项由新南威尔士大学主导的研究,通过大规模的功能性筛选,成功将那些隐藏在非编码区域的“垃圾DNA”转化为了理解阿尔茨海默病发病机制的宝贵线索。它不仅揭示了星形胶质细胞中复杂的基因调控网络,更为未来的精准医疗提供了潜在的靶点。随着我们对大脑“线路图”理解的不断深化,解开神经退行性疾病谜题的那把钥匙,或许就藏在这些曾经被我们忽视的DNA片段之中。

















