在中国,乳腺癌是女性发病率最高的恶性肿瘤。一组来自论文的数据揭示了一个严峻的现实:2018至2019年间,仅有22.3%的中国适龄女性接受了乳腺癌筛查;24.1%的中国乳腺癌患者在确诊时已步入III期及以上,这一比例是美国(11.8%)的两倍有余。
发现得越早,治疗效果越好,这是肿瘤学最基本的共识。但在中国的基层医疗体系中,钼靶设备覆盖率不足、超声筛查存在操作者依赖性、对致密型乳腺的灵敏度有限,这些因素共同构成了乳腺癌早筛在“最后一公里"的瓶颈。
近日,一项由浙江大学医学院附属第二医院联合AI科技公司奥明星程(OmixScience)和其它七家医疗机构完成的前瞻性多中心研究,发表于国际顶级期刊Nature Communications。该研究纳入550例乳腺癌患者和289例良性对照,开发了基于cfDNA片段组学的机器学习模型TuFEst®(Tumor Fraction Estimator),首次通过一管血同时实现了乳腺癌的极早期检测、无创分子分型和淋巴结转移预测,这也是迄今为止全球最大规模的cfDNA片段组学+AI乳腺癌研究。
这项研究的背后,站着两位角色截然不同但深度互补的通讯作者:
倪超,浙江大学医学院附属第二医院乳腺外科科室副主任,主任医师、博士生导师,一位每周要做30台手术的一线临床医生。他从临床痛点出发,主导了这项研究从样本收集、质控体系到临床验证的全过程。
林子奥,奥明星程创始人&CEO,哈佛大学计算机与生物医学双博士,癌症基因组学领域开山鼻祖Gad Getz教授唯一的中国籍博士毕业生。他带领团队构建了TuFEst®的底层算法平台,并正在推动这项技术从实验室走向产业化。
01
24.1%患者确诊即中晚期,中国乳腺癌早筛困局何解?
乳腺癌是全球女性健康面临的首要威胁之一。据统计,中国乳腺癌新发病例已从2015年的30万余例攀升至2020年的约42万例,跃居中国第四大常见癌症。更值得关注的是,与欧美相比,中国女性乳腺癌的平均发病年龄显著偏早。
“相比于欧美,我们中国人群的平均发病年龄要早十岁,而且首诊时分期偏晚的比例也远远高于欧美。"倪超主任向动脉网介绍。作为浙大二院乳腺外科的一线医生,他每天面对的正是这些“发现太晚"的病例。
在中国,乳腺癌筛查主要依赖超声和钼靶两种影像学手段。但现实的困境在于:许多基层医疗机构缺乏钼靶设备;超声检查依赖操作者经验,对致密型乳腺组织的灵敏度有限,诊断的一致性难以保证。这些结构性问题直接导致了筛查覆盖面的不足和早期发现率的偏低。
那么,近年来兴起的液体活检能否提供一条新路径?目前主流的液体活检方案包括基于突变检测和甲基化分析两大类。突变检测需要大量血液和超深度测序,在早期肿瘤中因变异等位基因频率极低(通常仅约0.01%)而灵敏度受限;甲基化检测虽然特异性较高,但亚硫酸盐转化过程会降解约90%的输入DNA,对早期肿瘤的灵敏度仅为50%-76%。更关键的是,成本限制了这些方案的大规模推广。
“像甲基化或者突变位点检测,成本太高了,在国外单次检测的成本大概在300到1000美金左右。这个放到国内明显不现实。"倪超主任解释道,“片段组学相对来讲价格比较低廉,差不多在百元级别,可行性更高。甚至以后可以期待政府把它纳入到我们两癌筛查的常规技术当中。"
此外,基因检测还存在人种适用性问题。倪超主任强调:“基因背景不同,人种差异很大,国外的模型在国内也用不了。涉及生物安全性的问题,我们一定要有一个中国人自己的方案。"
在这样的临床背景下,倪超主任团队联合奥明星程,启动了这项覆盖八家中心、800多例样本的前瞻性多中心研究。
02
839例前瞻性队列,8家中心验证,“一管血"同时回答三个临床问题
与以往液体活检研究的回顾性设计不同,这项研究从一开始就采用了严格的前瞻性队列设计(注册号NCT06016790),涵盖七家三甲医院和一家社区卫生服务中心。研究纳入了550例经病理确认的乳腺癌患者(其中77.1%为早期,即0-IIa期)和289例良性对照,对所有参与者的外周血进行低深度全基因组测序(约2×覆盖度)。
“做cfDNA研究最忌讳的就是样本不合格。"谈到研究质控,倪超主任回忆了团队在样本库中遇到的教训,“我们之前试过调取中心样本库的血样,发现合格率连30%都不到。如果一开始的研究就基于不合格的样本,那结论可能只够发一篇论文,而没有未来实际推广的应用价值。"
因此,这项研究的全部样本均从头采集:使用专门的cfDNA采血管,配备专门的保温箱运输,所有中心遵循统一的标准操作流程。这种“从零开始"的严格质控,也是研究数据可信度的重要保障。
在算法层面,TuFEst®模型采用了多模态融合策略,整合了cfDNA片段大小分布、末端序列特征、断裂位点模式、重复元件片段化信息以及转录因子结合位点覆盖度等多维度片段组学特征,并在六种机器学习架构中筛选出最优的堆叠集成模型(Stacked Ensemble Model)。
“TuFEst®打破了传统检测的维度限制,"林子奥博士解释道,“可以实现在极低成本下对肿瘤微弱信号的高信噪比提取,使大规模人群筛查成为可能。"
第一重回答:有没有癌?
TuFEst®模型在乳腺癌良恶性鉴别上表现出色。在训练集中,模型灵敏度达95%、特异性78.3%,AUC为0.937;在外部验证集中,灵敏度为92%、特异性86.9%,AUC进一步提升至0.968。
更具说服力的是一组特殊病例的验证:26例来自四家医院的早期乳腺癌患者,在常规筛查中被B超和钼靶同时判定为良性(BI-RADS 3级),但在六个月内因病灶增大接受活检后,病理证实为浸润性癌。在对这些患者初次影像评估时采集的血样进行单盲验证时,TuFEst®成功识别了其中25例,灵敏度高达96.2%,且这些病例全部为早期或无淋巴结转移的癌症。
第二重回答:什么类型?
乳腺癌的治疗高度依赖分子分型(ER/PR/HER2状态),不同亚型的生物学行为和治疗策略差异显著。研究团队在TuFEst®框架基础上进一步开发了TuFEst-MS模型,仅凭血液cfDNA数据即可区分管腔型(ER+/PR+/HER2-)、HER2阳性型和三阴性乳腺癌(TNBC),验证集AUC分别达到0.939、0.925和0.893。在21例已发生转移的患者中,该模型预测转移灶分子分型的准确率达到85.7%。
这意味着,在组织活检不可及或困难的情况下(如转移灶位置特殊),TuFEst-MS可为临床提供一种无创的分型参考,辅助治疗决策。
第三重回答:有没有转移?
腋窝淋巴结是否转移,是决定乳腺癌治疗方案的关键因素之一。传统影像学在淋巴结评估方面的灵敏度仅约50%-60%,准确性有限,常导致不必要的淋巴结清扫手术或治疗不足。TuFEst-LN模型的验证集AUC达0.874。在85例影像阳性但病理阴性的“挑战性"不一致病例中,模型的阴性预测值高达97.6%。
这一结果的临床意义在于:未来有望帮助更多临床评估为淋巴结阴性(cN0)的患者,更自信地避免不必要的腋窝手术,从而实现更精准的“降阶梯"治疗。
论文数据还揭示了更深层次的生物学关联:通过将cfDNA“癌症评分"与配对肿瘤组织的转录组数据(79例)进行关联分析,研究发现高评分肿瘤具有更活跃的细胞增殖、炎症反应和免疫逃逸相关信号通路,且免疫细胞浸润程度更高。这表明TuFEst®不仅是信号的捕获者,还在一定程度上反映了肿瘤的侵袭性生物学行为。
“不是为了测而测,"倪超主任总结道,“临床上目前还有很多没有解决的问题。如果一管血能同时解决这三个问题,那就直接能够改变很多未来临床实际的诊疗流程。"
03
每周30台手术的临床医生,如何走上AI液体活检之路?
倪超主任的身份首先是一名外科医生。
“我是一线的临床外科医生,每周大约要做30台手术。"他向动脉网介绍。这意味着他对乳腺癌的认知不是来自文献和数据库,而是来自每天面对的真实患者。正是这种临床一线的经历,塑造了他“以临床问题为导向"的科研理念。
除了乳腺癌早筛早诊,倪超的研究还聚焦于肿瘤免疫微环境方向,团队发现了一些新的可干预靶点并在推进临床研究。但在他看来,过去几年里对自己整个实验框架改变最大的力量,来自人工智能技术。
“像这次的cfDNA片段组学,我们提取了3000多个特征,你说怎么靠人去筛选?这不可能的。"他坦言,“必须要做医工交叉,利用人工智能或机器学习的技术才能够完成。"
跨学科合作是这项研究得以实现的关键。在倪超主任的叙述中,临床医生和技术团队之间是一种互补关系。“他们有时候不完全了解目前临床的真正痛点是什么,而我们知道。但他们手里有技术。这样强强联合,才能产出真正造福老百姓、符合国家导向的研究成果。"
就在论文发表之前,倪超主任团队已经启动了下一阶段的前瞻性人群筛查研究。他透露,团队承担了一项乳腺癌早筛的国家重点研发计划(科技部重大专项),目标是在三年内拿出面向真实筛查场景的验证结果。
他的愿景清晰而具体:“我们希望做到精准分层的筛查,而不是以前一刀切的模式。"高危人群应当缩短筛查间隔,低危人群则可以适当放宽。这样既降低国家卫生经济学上的负担,减轻老百姓的医疗负担,也让那些真正需要干预的患者得以更早被发现。
“最终,"他说,“我们还是希望能有机会被政府采纳,成为我国未来女性乳腺癌筛查的方案。"
04
从哈佛实验室到中国临床,TuFEst®背后的算法构建者
如果说倪超医生代表的是临床端的视角,那么90后林子奥博士则代表着这项研究中技术底层的另一条叙事线,他是TuFEst®算法平台的核心构建者,也是将科研成果转化应用的推动者。
林子奥博士,本科毕业于浙江大学,后赴哈佛大学攻读计算机与生物医学双博士,师从国际知名学者Gad Getz教授。Getz教授是癌症基因组学领域的开山鼻祖之一、TCGA等国际标杆基因数据库的核心构建者。林子奥博士是其唯一的中国籍博士毕业生。
在哈佛期间,林子奥博士深度参与了ICGC、TCGA和PCAWG等国际大科学计划,完整经历了从生物样本处理、全流程质控到高通量数据生成再到核心算法开发的整套技术体系建设。这段经历,直接为本次Nature Communications论文中TuFEst®模型的算法设计提供了方法论基础。
“Gad Getz教授对我影响最大的不是某一项具体技术,而是一整套科研方法论和数据驱动的思维体系。"林子奥博士回忆道,“从样本处理、全流程质控,到算法开发、模型验证,再到多中心数据的交叉验证,每一个环节都强调严谨性、可重复性以及在大规模数据上的泛化能力。"
正是这套方法论,构成了TuFEst®得以在3000多个片段组学特征中进行高效筛选与建模的技术基础。在这项研究中,林子奥博士团队负责的是算法架构的核心工作:多模态特征融合策略的设计、六种机器学习架构的系统比较,以及最终Stacked Ensemble Model的优选与调优。
“TuFEst®打破了传统检测的维度限制,"林子奥博士解释道,“可以实现在极低成本下对肿瘤微弱信号的高信噪比提取,使大规模人群筛查成为可能。"
而这项研究能够从算法走向临床验证,离不开与倪超团队的深度协作。倪超在采访中曾提到:“他们有时候不完全了解目前临床的真正痛点是什么,而我们知道。但他们手里有技术。这样强强联合,才能产出真正造福老百姓的研究成果。"
在林子奥博士看来,这种临床与技术的互补恰恰是中国医疗创新最需要的合作范式。临床医生提供真实场景的需求定义和严格的样本质控,技术团队则负责算法开发和模型验证,双方互为监督,既保证了数据的可信度,也确保了研究结论的临床可落地性。
“科技型企业,本质上是一个放大科研成果的机器。科研解决的是‘有没有可能'的问题,而我们要解决的是‘能不能规模化、持续地创造价值'。"林子奥博士如此定义科研成果转化的核心命题。他认为,这两者不是取舍,而是同一件事的两个阶段。“让科研真正走出实验室,便民惠民,产生更大的社会价值——这才是我们真正要做的事。"
博士毕业后,林子奥博士与赵翰晨博士、郝晋博士等几位哈佛同窗回国共同创立了奥明星程(OmixScience)。奥明星程是一家立足AI for Science(AI4S)底层范式,基于大模型的个体健康趋势预测及疾病干预的人工智能科技企业。公司始终以AI为核心引擎,推动AI与生命科学前沿融合,打造支撑生物医药上下游产业链的战略级核心平台,为新质生产力发展与全球科技创新提供范式引领与底层支撑。已参与承担国家人工智能创新高地建设任务、国家科技重大专项(“四大慢病”专项)、浙江省重大科技专项、深圳市重大项目等多层级项目,累计布局60余项知识产权,2项行业标准制定等。目前,公司已获得超亿元A轮战略融资,投资方包括深创投、复星医药(复健资本)、中国太平、广东中医药大健康基金(国开金融与恒健控股联合设立)、杭实集团等多家知名产业资本与政府投资基金,并与包括深圳湾实验室在内的多家国际顶尖科研机构建立了深度成果转化合作机制,形成覆盖技术研发、临床应用及产业生态赋能的全链条布局。
“我们做的不是一个单点的筛查工具,"他强调,“我们本质上是在构建一个可以持续学习的生命状态解码系统。"
在林子奥博士看来,真正决定疾病发生发展的是分子层面的动态变化,而非影像阶段的“结果呈现"。多组学数据正是直接反映这些“底层信号"的生产资料。AI的价值在于整合不同模态的数据,基因组、转录组、蛋白组等多组学数据,以及医学影像、数字病理、电子病历等多源异构信息,从中捕获更复杂的关联关系。
这项发表在Nature Communications上的研究,标志着液体活检在乳腺癌管理领域从单一维度检测迈向了“一管血、三重回答"的整合评估新阶段。但对于倪超主任和林子奥博士而言,这只是一个起点。
倪超主任团队已启动后续前瞻性人群筛查研究,目标是三年内拿出可在真实筛查场景中应用的产品化方案。林子奥博士则致力于将TuFEst®平台的应用场景从乳腺癌等已验证领域,持续拓展至更多疾病方向。他认为,平台所构建的底层方法论具有高度的普适性,能够为复杂疾病提供覆盖筛查、诊断、治疗、干预、预后管理及监测的全周期系统化支持,并最终通过智能体实现个体化健康管理,形成完整闭环。同时,通过结合智能体和CRO服务,平台可以为药企、生物医药公司、医院、保险公司及政府等多元主体提供全方位支持。
从临床痛点出发的倪超医生,和掌握国际领先原创AI技术体系的林子奥博士,他们的携手本身便是中国医疗创新进程的一个生动缩影——前沿科技正跨越实验室与论文,通过“国际前沿技术”与“中国临床需求”的强强联合,切实转化为服务于广大中国患者的智慧医疗产品与扎实的临床解决方案。这不仅是“AI+医疗”的深度融合,更是“全球智慧”与“本土实践”共创价值的典范。
论文链接:https://www.nature.com/articles/s41467-026-70204-w

















