如果我们把外科手术类比成开车,那么人体的地图就不可或缺。
在胸片的时代,这个地图是一个粗略的文字描述,告诉我们左肺这儿有个东西,应该手术进去探查。
在CT的时代,地图变得精确了很多,变成个纸质地图了,告诉你北京长这个样子,然后人民医院这地方有个肿瘤,你得去看看。
在AI三维重建阶段,它又进化了,变成一个电子地图。我们可以随便缩放、旋转,可以把它放成跟我现在眼睛前面看的路的方向一致。
有了一个好的地图以后,后面的干预措施才能进一步加强。CT的三维重建对于外科来说是走向自动化的重要的一步,类似于从纸质地图变成电子地图这样的一个意义。
陈修远医生如是说。
1胸部三维重建:从闭眼学车到全景导航
在肺部三维重建普及前,以陈修远医生为代表的胸外科医生时常面临着诸多困扰。
肺部天然的复杂解剖结构类型和手术中器官的较大的活动性造成了极大的阅片难度。以背段动脉为例,是一支还是两支,在手术牵拉下是什么情况,对手术是否有影响,这些仅靠阅片都很难确定,往往依赖术中的实时判断。
这种复杂性导致年轻医生只能在有限的手术时间和样本中学习,经验积累的机会大大压缩,学习曲线不断延长。进而由于经验的不同产生认知偏倚,导致外科医生之间对CT的理解存在着很大的差异。
陈修远医生笑谈到,很多从学生时代就积累下的对肺部结构的认知,后来通过AI辅助的智能三维重建,都被证实是错的。
2020年,随着行业内肺部三维重建算法的逐步完善,临床应用的可能性不再是幻想。陈修远医生开始思考临床试验该如何设计。
随机对照试验(randomized controlled trial ,RCT)是临床试验研究的重要类型之一,但对于AI影像技术,尤其是陈修远医生所设想的未来,RCT研究或许并不适用。
如果按照III期临床试验的思路去进行RCT研究设计,把AI三维重建作为一种干预方法,选择的评价指标必须是术期有效性和安全性的指标。然而无论是围手术期出血或术后二次手术比例还是更远期的肿瘤生存指标,在数据的可靠性和试验的耗时方面均存在很大困难,尤其是为了达到足够的阳性事件,可能需要上万例的样本量。
样本量上万,怕是所有外科临研人看到都眉头一紧。
如此大规模的临床试验规模,纳排、时间周期、研究成本、医生对AI的接受度都是难以解决的问题。
陈修远医生需要从“AI”和“影像”中寻找线索。
2引入“多阅片者多病例”研究设计
Multi-Reader Multi-Case (MRMC) 设计是一种用于评估医学图像诊断准确性的医学研究方法。这个设计考察多个医生(Reader)在阅读多个病例(Case)的情况下,完成某种医学任务的表现。通过这种方式,我们可以了解不同医生之间的一致性,同时也能比较不同的测试方法或影像技术的效果。
在MRMC设计中,每个医生会看到一系列不同的病例,然后根据他们的专业判断给出诊断。研究人员会分析这些诊断结果,以了解医生们在不同情况下的表现。这种设计的优势在于同时考虑了医生和病例的多样性,更贴近医学实践。
陈修远医生表示,MRMC可以通俗的理解为一个介于诊断性试验和干预性试验之间的设计。一方面,每一个病例经过医生阅片后输出的结果是一种手术认知,但这种认知并非传统诊断意义上的二分类变量,而是一种更加复杂、全面的认知;另一方面,这种认知会在一定程度上干预手术选择,但由于试验是在理想状态下设计进行,并不会直接作用于入选的患者。MRMC研究所评价的是这一新方法和医生与患者三者之间的关系。多的这一层医生的关系,尤为适用于AI辅助下的医学影像技术。
32年时间,400余例入组
经过接近两年的前期筹备与反复完善,2022年陈修远医生所在的北大人民胸外科团队与推想医疗合作,开展了一项多中心临床试验。
试验在北京大学人民医院,上海市肺科医院,湘雅二院入组了400例数据,而后随机选取了对应样本量要求的数据,组成最终的数据集进行研究。
从外科手术角度分析,数据集包括了肺叶和肺段切除的患者,病灶在5个肺叶上均有分布。从术前CT图像参数角度,试验覆盖4家普及率较高的CT设备商(GE-飞利浦-西门子-联影),进一步保障了研究数据的代表性。
陈修远医生对于此次试验的设计有着多方面的考虑。
首先,患者均选自有大量门诊量且有地域分布的代表性中心,覆盖全面;再者,本次临床试验的临床终点也创新的选取了对于解剖结构识别的准确性和时间优效性;而最重要的,便是通过MRMC全交叉设计提高研究的严谨性。
所谓全交叉设计,是指全部阅片者对每一种阅片模式下所有病例的影像数据给出阅片结果。试验同时考虑到是否使用AI辅助顺序上可能产生的偏倚,将阅片医生随机分为两组,分两轮进行试验。在第一轮试验中,一组医生使用AI辅助阅片,另一组医生不使用;经过28天的洗脱后,在第二轮试验中,两组医生使用与第一轮中不同的方法进行阅片。
陈修远医生与推想医疗选取的这种最为严格的MRMC设计能够通过每一个医生的自身前后对照,尽可能消除阅片者水平之间差异带来的影响,准确地反应AI三维重建技术对于各个年资医生提供的可以量化的帮助。
借助此次全球首个胸外科AI临床试验,推想医疗胸外手术规划产品成功获批三类证,是首个且唯一一个获得NMPA三类证批准的肺部手术规划产品,可为胸外科医师制定肺部手术计划提供参考。该试验达到主要终点,证实了AI系统可以有效的提升医生的解剖结构识别准确率,术式选择的准确率以及手术切除范围判定的准确率。
此次手术规划产品获批三类证,对于患者和医生有着双重的价值。在患者的角度,三维重建的图像可以增加其对手术的理解,降低恐惧,增加信心;同时由于AI三维重建减少了对造影剂的依赖,对于一些不需要拍摄胸部增强CT的患者可以有效降低造影剂相关的安全隐患以及经济负担;在医生的角度,AI三维重建对于增加手术的确定性,降低手术难度,提升手术成功率,以及入院合规等方面都有重要意义。
4对于AI与临床的思考
对于AI在临床中的应用,陈修远医生有着近、中、远三重的感受。
在应用上离自己最近的一端,是AI辅助三维重建对于教学和医患沟通的改变。前文提及过,三维重建给包括陈修远医生在内的医生群体对于肺部解剖结构的认知有了全新的提高,对于后继医生的学习曲线都有了极大的缩短。而在医患沟通方面,陈修远医生对于不再需要用五根手指来类比肺部位置,可以改用三维试图向患者精准表达切除位置及大小而表示宽慰。
在可预见的未来,陈修远医生希望看到AI的应用可以从诊断过渡到干预。从相对偏软一点的干预(比如影像的风险提示,入路的辅助规划),到比较硬核一些的干预(比如直接辅助操作,用机器人进行错误动作纠正),最终由人对机器的动作进行校准和纠错。
而在AI出现后,对于医疗领域本身长期的变化,陈修远医生给出了独特的解读。
陈修远医生认为,在medical AI出现后,借助AI做出的产品/技术想解决和能解决的问题变得更加多元化。传统终点指标所表达的问题是否还绝对适用?医生和病人的信心度、满意度,这些东西到底有没有价值?更多的东西需要去综合的考量,当终点指标的维度增加了以后,统计学上研究者们要如何去平衡?
这些来自临床医生对于AI的思考,无疑给了科研端与产业端全新的角度。也正是凭借这些思考,才有了更符合新技术新产品需求的前沿性试验设计。