近日,四川大学华西医院公示,将四项专利通过评估以及协议定价的方式,以400万元人民币以及2%销售收入提成的拟交易价格,转让给脉得智能科技(无锡)有限公司。
据悉,四项专利分别为:“一种基于深度学习的短序列比对方法、设备及存储介质”(专利公开号:CN118351938A)、“一种基于深度学习的变异识别方法、装置及存储介质”(专利公开号:CN118197420A)、“抗生素耐药基因或毒力因子的基因预测或分类方法、装置、设备、”、“大队列宏基因组的条件致病菌的识别方法、装置及存储介质”(专利公开号:CN118380054A)。目前,交易已通过公示期。
这四项专利均为人工智能与基因监测方向。通过深度学习,不同维度特征图像的合理融合可以潜在地增强深度分类网络,可以捕获更丰富地基因组学信息。进而进行短序列比对、变异识别、大队列宏基因组的条件致病菌识别以及抗生素耐药基因或毒力因子基因预测等。使得科研人员更好的分析疾病,对抗疾病。
一、推动基因组学人工智能平台DEEPOMICS发展
脉得医疗成立于2018年,是一家专注人工智能医学大数据算法研究领域的人工智能医疗科技企业。据公开资料显示,该公司由院士团队组建,拥有海外实验室雄厚的人工智能综合研究实力。
以人工智能为出发点,脉得医疗主要涉及三大方向:一是医学数据科学应用与人工智能专家诊疗系统平台;二是新一代高性能精准影像诊断软硬件设备及服务产品,配套远程诊断平台;三是基因组学人工智能平台DEEPOMICS。
本次交易专利能够提高DEEPOMICS平台的能力,使其能够更为准确对人体基因组进行识别,进而推进个性化医疗医疗以及精准医疗的发展。
另外值得注意的是,目前在医学影像方向,脉得医疗已经取得了一定的成就。其研发的甲状腺AI原型产品ITS100于2021获批二类证,已经进入市场化。
据悉,ITS100拥有超大规模卷积神经网络、深度学习技术,能够达到甲状腺有无结节、结节良恶性以及桥本氏甲状腺炎及其复杂背景下的病灶的彩超定性、定位、边界分割实时辅助诊断,并出具结构化人工智能诊断报告。未来有望降低不必要的甲状腺穿刺活检,进一步建立起无创化诊疗决策支持和微创化手术辅助流程的系统创新。
二、基因组学AI工具研究的三种方向
目前AI在医学领域的应用已经颇为广泛,在基因组学领域AI也表现出不俗的潜力。
基因组学是一项对生物体所有基因进行集体表征、定量研究及不同基因组比较研究。它不仅关系到人类对疾病以及遗传基础的认识,同时还是理解药物反应的基础。研究基因组避免不了处理大量繁琐复杂的数据,而AI系统所具备的捕捉大型数据集和不同数据模态组合中复杂模式的能力,恰好能够应对基因组学研究中繁杂的数据,成为推动基因组学发展的强大工具。
目前海内外多个科研团队均在尝试创建新的AI工具,推动基因组学研究。
首先,是解读非编码遗传变异。和有序的遗传数据相比,非编码遗传变异更加复杂且不易解读。但它又关系到疾病的发生以及发展,对其进行破译或能正确预测疾病的发展趋势。
2020年,牛津大学研究团队就曾提出一个名为DeepC的AI模型,可以使用兆碱基规模的迁移学习准确预测拓扑相关域(TADs)。DeepC能够从DNA序列的百万碱基(Mb)窗口预测基因组的折叠方式,从而可以预测原始序列的变异如何影响三维基因组结构。据悉,在新冠疫情期间,DeepC已经被用于预测患者症状表现,并找到了该疾病引起呼吸衰竭的单核苷酸非编码变异和作用基因。
其次,是结合不同数据模态解读基因组数据。基因组学中存在大量繁琐、无序的数据,需要通过多维度解读,才能在后续研究中得到应用。
2022年,斯坦福大学、哈佛大学、多伦多大学以及耶鲁大学医学院的科研团队合作提出了通用医学人工智能GMAI。这项模型能够使用非常少量或没有特定任务的标记数据执行各种任务,包括处理成像、电子健康记录、实验室结果、基因组学、图表或医学文本的数据等。而在数据繁多的基因组学研究中,简化数据并提供决策指引是非常重要的部分。团队表示,未来GMAI模型将为科研工作者提供高效准确的多维数据分析、提供临床决策支持、成为新型多功能医学助手。
最后是解读液体活检数据。体液中存在大量的循环游离DNA,无论是在临床活检还是实验室鉴定中,这些DNA都具有重要意义,因此这也是科研人员重点关注的研究方向。
近几年在国内也涌现出大批基因组学AI模型的研究。中国科学院多学科交叉研究团队组成的“指南针联盟”,专研人工智能在生命科学研究方向的赋能。在2023年,该联盟发表了两项重要成果:世界首个跨物种生命基础大模型GeneCompass;基于迁移学习的基因调控网络生成模型CellPolaris。
据悉,GeneCompass采用的训练数据集包含小鼠和人类的超过1.26亿细胞,是当时规模最大的高质量训练数据集。同时,GeneCompass还首次将基因编号和表达量进行双重编码,使得能够对各种特定条件,如细胞类型和扰动状态的基因-基因相互作用提供更加精准分析。
三、海内外大药企入局基因组学AI工具
在产业端,基因组学的AI工具研究也展现蓬勃之态。但对于大多数企业而言,AI工具仅是管线中一部分,鲜少有仅研究基因组学AI平台的企业。
前有阿斯利康与Illumina进行合作,使用使用Jarvis和其他计算机预测器,整合进更大的框架中,分析大规模多组学数据集,以识别致病基因变异。后有基因泰克与GNS Healthcare合作,通过分析电子病历和下一代测序数据,寻找并验证潜在的癌症药物靶点。另外,礼来、拜耳、辉瑞等均在这一领域有所布局。
在国内也涌现出了相关企业,如商汤科技、晶泰科技、英矽智能等均在和AI企业进行合作,研发相关工具推动药物研发。而像阿里、腾讯等互联网企业业纷纷入局。目前,腾讯 AI Lab正在单细胞蛋白质组学领域进行研究。据公开资料显示,腾讯 AI Lab已经推出了单细胞蛋白质组数据库SPDB、多功能算法 scPROTEIN、反卷积方法 scpDeconv等。未来还将利用现有基础,整合单细胞多组学和蛋白质大模型,推动临床应用研究。
另外,还有一些企业该换赛道,准备乘风而起。成立于2006年的赛业生物原本是以动物模型为研发核心。在近几年,依托大量基因研究基础,它开始向基因组学的AI平台发起研究。赛业生物创新开发了“AI+GCT”CRO服务平台,能够通过AI助力基因治疗载体AAV病毒衣壳蛋白的设计优化,从基因治疗上游的病毒载体构建与开发,中游的病毒包装与生产、基因治疗疾病模型构建,到下游的基因治疗有效性评价。
同时,赛业生物还和清华珠三角研究院人工智能创新中心合作,创建了罕见病数据中心,为罕见病的治疗以及诊断提供数据基础以及智能方案支持。