登录

环宇瑞声:用声音识别肺病患者,基于声学标志物的智能诊断技术已启动临床研究

季嘉颖 2024-08-09 08:00

今年是第29个“世界防治结核病日”,主题为“你我共同努力,终结结核流行”。虽然人类与结核病间的缠斗已有数千年之久,但结核病仍是仅次于COVID-19的全球第二大致死性传染病。尤其在中国,无论是结核病的预防、发现,还是治疗均与理想状态存在差距。

 

首都医科大学附属北京胸科医院副院长李亮对动脉网说道:“结核病是地球上最古老的传染病之一,据WHO发布的《2023年全球结核病报告》显示,中国2022年估算的结核病新发患者数为74.8万,在30个结核病高负担国家中排第三。世界卫生组织提出要在2035年‘终止结核病流行’,但如果目前结核病的诊断技术、治疗药物、疫苗以及防控策略没有大的突破情况下,终止结核病的目标还有很大差距。”

 

幸运的是,人工智能、信息技术和计算机科学的发展为数字健康领域带来了新的机遇,一项“基于声学标志物的AI智能靶点技术”将有望帮助临床医生在肺结核以及其他呼吸系统疾病等领域实现疾病大规模的早筛早诊。该技术是由北京环宇瑞声科技有限公司(以下简称:环宇瑞声)携手首都医科大学附属北京胸科医院(以下简称:北京胸科医院)联合研发。

 

重构诊疗模式,打造声学标志物的AI智能诊断技术

 

谈及创业初衷,环宇瑞声创始人、CEO高政回忆道,“环宇瑞声的成立,源自在新冠疫情背景下,对科研成果转化需求的迅速响应。”

 

2020年新冠肺炎疫情暴发之际,环宇瑞声与中国科学院声学研究所“基于声学特征自动检测的新型冠状病毒肺炎智能诊断方法”的北京市科委课题,开展深度合作和研究。团队对从坦桑尼亚、首都医科大学附属北京地坛医院、辽宁省新冠肺炎救治中心等收集的关键声音样本,进行了细致、专业的声学分析,揭示出新冠患者与健康人群在声学特征上的显著性差异。同时,该技术与北京大学第三医院等机构合作,成功应用于北京2022年冬奥会和冬残奥会的医疗保障工作。

 

经历数年沉淀,环宇瑞声目前正在开展将该AI技术应用于肺癌、肺结核智能诊断的临床研究。该项目与首都医科大学附属北京胸科医院合作,并由李亮副院长担任项目的首席顾问;杜建副院长担任项目首席策划;杜晔副院长担任项目高级指导;杨新婷主任医师担任课题负责人。

 

从底层技术来看,何为“语音生物标志物(Voice biomarker)”

 

高政对此解释道:“追本溯源,中医自古强调的‘望闻问切’中的‘闻’就是指听声音、气息;现代医学领域中的听诊器更是发布于1819年,大型医疗器械设备出现之前,医生主要是通过听诊来判断疾病。由此可见,声音数据自始至终都是医学范畴内的必要的医疗数据。如今,AI和计算机技术的发展扩展了声音分析的范围,如咳嗽、呼吸和说话声等,人体发声器官的物理结构会随着生理和病理状况而改变,从而导致不同疾病患者的语音产生特异性变化,这些声音特征可作为疾病的‘语音生物标志物’”。

 

高政接着举例说道,“肺癌患者因主动脉瘤、纵膈肿瘤等压迫支气管导致咳嗽金属音并伴随声音嘶哑,肺炎患者则因一侧或双侧肺泡发炎引起的感染导致肺泡充满液体或脓液,而发出伴随痰鸣音的咳嗽音。不同疾病的声学标志物具有独特性和差异性,通过梅尔语谱图(Mel-spectrogram)进行可视化特征鉴别性分析,可以发现肺癌、肺结核与健康人之间声音的显著差异,从而为疾病诊断提供全新的视角和方法。”


image.png 健康人和肺部疾病患者的梅尔语谱图

 image.png 

中央型肺癌的支气管剖面图

(肺癌患者咳嗽金属音为高速气流摩擦力撞击狭窄气道而产生的高频支气管呼吸音)

受访者供图

 

作为呼吸系统疾病专家,李亮也对声学标志物技术在结核病早筛早诊领域应用的前景表示了高度认可。他指出,快速发现结核病人并提供及时治疗是避免结核菌传播的主要途径,但目前临床上主流的诊断技术还比较“原始”,并且诊断以院内为主,院外市场缺少普适性的无创诊断产品。例如,应用最广泛的痰涂片距今已有百年历史,并且该方法的阳性率只有约30%,从取样到出结果往往至少需要一个月时间,准确率、效率和速度均较低。虽然最新的分子生物学诊断技术的准确性和效率有显著提高,但受成本和技术的限制导致其很难在基层医院推广。与此相对的是,结核病患者实则多在基层被发现。

 

因此,面对国内医疗资源的不均衡、地区发展差异以及医患比例失衡等挑战,一种结合了智能化、便携化、精准化、远程化,并具备大规模筛查能力的创新医疗工具——基于声学生物标志物的AI诊断技术,将极大提高医疗资源的普及和下沉,提高基层医疗机构的响应速度。

 

便携化、精准化、远程化,构建全流程、多场景的智能解决方案


环宇瑞声研发的基于声学生物标志物的AI诊断技术,通过捕捉和分析人体健康状况变化所引起的细微声音差异,展现出在呼吸系统疾病、心脑血管疾病的筛查、监测和辅助诊断方面的显著潜力。这种技术不仅为终结结核病流行提供了新技术的支撑,也响应了国家新质生产力的发展方向,同时也为其他疾病的早筛早诊提供了可能。

 

首先,环宇瑞声的优势体现在数据数量和质量上。“公司不仅成功开发并规模化应用了国内首个基于声学标志物的AI诊断大模型,截至目前该系统平台用户已累计2390多万,实现了6500多万次的使用和超2亿次的访问量,而且公司还积累了6000多万的声学样本数据集,这一数据量在5-10年内很难被其他机构和公司超越,除非再次出现全球性的流行病。”高政说道。

 

紧随其后的是算法优势。据介绍,环宇瑞声的核心科研团队主要来自中国科学院的语言声学和内容理解重点实验室,该实验室是省部级双重点实验室,代表了我国在该领域的顶尖水平。

 

凭借实验室超过20年的深厚科研积累,环宇瑞声在没有依赖外部开源工具的情况下,完成了声学图谱分析与检测、多维鲁棒特征提取、分类建模及数据增强、综合决策与诊断等关键算法的研发,构筑起强大的技术壁垒。

 

对此,高政表示,“AI系统的大模型在2024年3月完成,基于2000万条声学数据训练,以及超过10000小时的训练时长,大大提高了该模型在真实世界场景下的稳定性和泛化性。

 

应用场景方面,环宇瑞声面向B端和C端开发了两款产品,分别是针对呼吸系统疾病检测的APP和针对心脑血管疾病的智能听诊器。

 

image.png环宇瑞声产品矩阵

受访者供图

 

用户仅通过智能手机和IOT设备,即时检测、管理肺部和心脑血管疾病。这项技术不仅实现从院前筛查到院中诊断,再到院后随访的整个医疗流程,而且能够适应多种复杂场景。

 

通过非侵入性的体外诊断技术,有助于实现疾病的早期发现和管理。更重要的是,通过人工智能技术促进了优质医疗资源向基层地区的普及,有望大幅降低全社会的医疗成本,提高医疗服务的可及性和效率。

 

环宇瑞声还参与北京胸科医院主办的“一扫双筛”全国性的义诊活动。通过采集基层社区人群的声学数据,特别是针对Lung-RADS 4级结节的声音数据。这些数据被整合入其声学算法模型中,当用户接受声音检测时,系统将对这些高风险人群发出预警,从而进一步实现对肺癌的早发现、早诊断、早干预。

 

跨学科医工交叉团队,瞄准更广泛医疗场景持续深耕

 

作为一支深耕医工交叉的队伍,环宇瑞声CEO高政是人工智能应用高级工程师,拥有人工智能、数字信息化、智慧医疗、企业管理等跨学科、跨业务交叉工作经验,还曾任多家科技公司的核心管理职位。

 

创始团队具备诊法数据库设计、声学信号处理、自然语音处理与大数据计算、生物学、临床医学和生物信息学等多学科的交叉研究背景,并且有多个生物医药及其他高科技项目商业转化成功经验。

 

在这支拥有多学科交叉,以及丰富的研发、管理、商业化背景的团队带领下,公司已同多家三甲医院开展立项研究。例如,与中国医科大学附属第一医院开展了基于声学生物标志物的颈动脉狭窄智能诊断技术研究,目前该项目的颈动脉狭窄辅助诊断准确率已达到97%。

 

在采访的尾声,高政提到了谷歌2024年初在nature发表的一篇研究论文,站在行业前沿,分享了公司自研的基于声学标志物智能诊断技术的领先优势。

 

这篇研究论文中介绍了谷歌开发了一款系统名为HeAR的AI诊断大模型,其新颖之处在于其训练所用的海量数据集。这个人工智能系统在YouTube视频中提取了超过3亿个咳嗽、呼吸、清喉咙和其他人类声音的短声音片段来进行自监督学习。谷歌的研究人员将HeAR模型进行微调用于检测COVID-19、肺结核和个人是否吸烟等特征。HeAR在COVID-19检测方面的得分为0.645和0.710,这取决于测试的数据集,对于肺结核检测,得分为0.739。由于HeAR模型的原始训练数据非常多样化,具有不同的音质和人类来源,这也意味着其训练结果具有普遍性和可靠性。

 

高政表示,“与这篇论文中公布的数据对比,环宇瑞声在自有训练数据集,以及判断准确性等方面均超越HeAR。目前,针对肺结核与健康人的检测得分为0.91;混入其他肺部疾病和健康人的检测得分为0.827。在技术领先性的驱动之下,公司的短期目标是深化与北京胸科医院的科研合作,将肺癌和肺结核智能诊断作为首发产品,完成临床研究并迅速推进至临床应用阶段,发挥创新技术的社会价值。”

 

谈及长期规划,高政说道,“未来,环宇瑞声将专注于病理学、临床医学与人工智能技术的交叉研究,将基于声学标志物的AI智能诊断技术,扩展至其他呼吸系统疾病、心脑血管疾病、神经性疾病(例如阿尔兹海默症、抑郁症、创伤后应激障碍等),以及胎心音等更广泛的严肃医疗领域,通过人工智能技术为用户带来便捷高效的医疗服务。”

 

最后,李亮强调:“声学标志物在医学辅助诊断中的应用潜力还需在临床中进行检验。但我相信,随着我们对生物学和人工智能的深入理解,AI声学智能诊断技术在无创即时诊断领域的应用范围将日益扩大。我们可以乐观地预见,这项技术在肺部疾病、心血管疾病等众多医疗领域的应用前景是非常广阔的。”

 

专家介绍


image.png 

李亮

首都医科大学附属北京胸科医院副院长;主任医师;博士生导师


中华医学会结核病学分会前任主任委员、中国疾病预防控制中心结核病防治临床中心副主任、中国结核病临床试验合作中心副主任、世界卫生组织结核病研究培训合作中心副主任、国家卫健委疾病控制专家委员会委员、国家卫健委“健康中国”科普委员会委员、国家药物政策专家库成员、全国疾病预防控制专家委员会委员、全国“健康中国”科普委员会委员、《中华结核和呼吸杂志》副总编、先后承担或组织国家十一·五重大专项、国家十二·五科技重大专项、国家十三·五科技重大专项“耐药结核病缩短疗程研究”“国际结核病合并糖尿病双向筛查”等课题近三十项;先后发表文章近100篇;主持编写或翻译图书30余部。

热门标签: #临床#诊断
注:文中如果涉及企业数据,均由受访者向分析师提供并确认。
声明:动脉网所刊载内容之知识产权为动脉网及相关权利人专属所有或持有。转载请联系tg@vcbeat.net。

季嘉颖

共发表文章130篇

最近内容
查看更多
  • 低成本实现毫米级多靶点辅助定位,复通汇智打造全球首创经颅磁刺激整体解决方案

    2024-09-09

  • 基础切速达10000CPM,双气路驱动,佳视诺德取得眼科高端医疗器械新突破

    2024-09-06

  • 迎击市场变革,塑造综合竞争力,加速医用高值耗材创新落地与数字转型

    2024-09-05