智能生物与医疗一直是BV百度风投深度投资布局的方向之一,从AI药物研发到下一代手术机器人,从单细胞测序到体内传感器,BV成立两年来足迹踏遍中美的无数实验室,投资了超过30家的前沿生物医疗企业,以下是BV生物智能小组关于投资关键词的分享。
作为AI基金,我们对生物医疗行业充满向往也充满敬畏。当我们已经在城市的血管上使用了这么多人脸识别技术的时候,我们同时也想去探索更微观的生物世界,去看看人类的血管,去研究人体真正的细胞;当我们在讨论了这么多关于城市行为里提炼出的规律,并思考怎么去精准补偿和提前干预的时候,同样的很多类似的思考我相信也可以用在医疗领域。城市是一个大的生命体,那么让我们今天聊一聊AI如何改变我们每一个生命个体。
对AI,相信大家都不陌生,从大概十年前我们开始系统的投资AI,到现在AI已经变成了一种显学。那么AI的核心能力是什么呢?大家众说纷纭,按我们自己的理解,其实AI还是由数据而来,朝着提升整个系统的效率而去。AI的核心关键就是理解能力,就是从技术本质上加深基于计算、基于感知、基于学科基础的理解,其核心则是一种提升柔性化数据的能力。其中一个重要环节就是AI去感知、理解和提炼数据的时候不需要非常高度结构化的客观数据,反而可以是图片、影像、以及很多模糊的东西。拿人体来打个比方,人体中任何两个细胞都不是完全一样的,如果是基于规则的识别,可能会把略有不同的细胞当成两种。而AI对模糊数据的处理和原始数据的利用,则带来了一种新的能力。从非常海量的数据中,比如说大样本乘以多个数据轴,再乘以长时间轴中,找出超出人类想象或者逻辑推理的规律,以一种启发式的方式去发现基于概率的规律,正是AI所带来的理解能力和规律发现能力的核心。AI在用这种能力逐渐重塑我们的城市的同时,也在逐渐改变我们对于未来生命体的理解。
回到医疗的话题,虽然AI这个概念听上去很牛,但是在医疗领域还有很多的问题并没有被解决。举一个简单的例子,在5毫升的血液中有什么?我们知道约有10的10次方的红细胞,10的7次方的白细胞,10的8次方的血小板,再乘以个体数量,这个数据量已经远远大于城市里的人的数据量。所以今天无论是医学检验还是AI,对这个问题的理解都不深入。在我看来,这里面恰恰存在着无限的空间和可能。今天无论是AI还是其他的检验方法,多数还是在寻找目标的少数强特征。当目标的特征足够强的时候,用这个特征我们就能把它找到并识别出来。目前我们对细胞的认识还停留在了细胞群体整体变化的层面,比如说很多血样检验还是把一类细胞当成整体来看,来观察整体这一类细胞的变化。在未来,我们相信取代整体感知的会是对每一个细胞个体独立的分析,我们坚信未来是一个单细胞感知数据的时代。
今天AI跟医疗的结合已经在高速发生,很多专家和创业者已经开始在这里个领域发掘很多的商业机会了。我觉得往未来20年看,AI底层技术的快速发展,会为这个行业带来一些新的驱动力,这受益于AI在各行各业的应用,包括过去二三十年微观尺度的材料科学、物理科学等的发展,也包括高性能的计算、新算法等叠加起到的综合作用。
新的底层技术为AI的赋能,首先是感知。今天AI系统所使用的数据,某种意义上绝大部分都还是原来为人类所开发的数据。比如说今天的图像,无论是刚才谈的城市的安防影像还是医疗的影像,很大程度上是要让人能看得懂,所以要关注与人感知能力相关的成像的质量,为这种质量可能会丢失很多物理信息的采集。因而类似非可见光的波段或者非常高频的信号变化,在人眼视觉感知时代是被忽略的。而在AI感知时代,我们投资的为AI所开发的下一代的基础感知器件则会带来超高速的纳秒级的高分辨度数据。超分辨的感知能力会带来很多额外的结构数据,这些人类原本不能或者很难消化接受的信息,比如三维的或者更高维度的成像,或者非可见光的光谱信息,会逐渐的渗透到我们的系统中,在原始的物理世界跟AI的感知计算能力之间搭建一个更好的桥梁。这些信息采集的源头驱动力来自于微纳米电子学、量子物理等所有底层技术学科的发展和变化。而我们认为这些更细致更高纬度的感知在未来的20年内,会逐渐的通过一些切入点进入到我们的医疗行业,给我们的创业者带来更多的可能性。
这里我们讨论一些案例,有的是已经在发生的,有的是我们投资的,有的是学术刊物上讲到的。比如对空间维度的提升,因为前面提到AI最大的优势在于如何找到更多的由于人类理解受限而无法发现的规律,来对疾病做全新的理解,而不是简单的去重复人类医生已经做得比较好的工作。因而作为一家AI机构,我们在医疗领域的投资就是围绕着帮助这个领域带来更多的数据轴来进行投资和布局的。就好比我们把人体当成一个城市来看,通过增加各种传感器,为大家带来更多的数据轴,可以供各位医疗专业的从业者在原有的数据方法的积累交叉的基础之上,去找到新的规律。在这个方向上,空间维度的提升就是一个典型的例子,比如3维病理系统,通过对病理的更细分的切片、3D扫描和3D重建, 获得了比2维多出来的Z轴的连续信息,已经开始越来越多进入新药的研发、临床前的应用。同样类似的,在不同尺度上我们都有这样的精细结构需求,例如基因领域,我们现在主要利用的是碱基排布的序列信息,而DNA的3D结构的观测技术,有可能能够真正带来全新的信息维度。
除了空间维度的提升,信息的变化也可以来源于颗粒度的提升,典型的例子就是活体细胞超分辨率显微成像。超分辨率的结构感知,恰恰需要AI技术中压缩感知技术的发展,通过多次的有序控制的成像、叠加计算、消除误差,来超过光学衍射的极限。再往前走一步,这些都还只是满足人类的肉眼所采集的成像信息。如果没有了这个负担,而只是把数据采集更好服务于机器系统识别的话,也许分辨率还可以有更高的提升。我们坚信在未来会有越来越多这样细胞里面的微观结构数据,结合AI系统提炼,能为我们带来新的智慧。举例来说,我们在美国已经投资的一家公司则使用干预的方式提升了数据的动态性。通过对单细胞本身的视觉分析、以及给予一定外力来挤压和形变,采集细胞形态上变化的数据,并在这个过程中来建立新的与疾病关联的模型。这是超出传统上的细胞数据轴的典型案例。
此外,提升不同数据轴的数量也是我们关注的一个领域,这也是这些年前沿生物信息投资领域的一个热点。比如说在人体基因组的基础上改,去观测肠道微生物基因组,也会为医疗领域带来大量新的信息维度。
除了空间维度的分辨率、数据轴的颗粒度以及数量的提升,另外一个核心的驱动力也包括时间分辨率的提升。今天传统的医疗数据的主要挑战正是时间分辨率的过低。这是在未来的至少五到十年内需要快速发展的一点,也正是AI的感知技术所能助力的。AI的感知技术现在正快速地朝着低功耗、自供能、超小型方向走。举例来说,基于血液系统、利用光和环境供能和感知的低功耗的超小型的传感器,已经可以使用于青光眼的眼压监测。这个传感器其中不仅有感知的能力,有信号传输的能力,还有基础计算的能力。在我们永远希望拿到最高时间分辨率的在线数据感知情况中,永远存在在一个悖论:第一种情况是, 虽然信息传输的单次功耗非常低,但是因为我们想要让数据持续传出来,所有信息传输累积起来就会有很高的功耗消耗。第二种情况是, 如果不把数据传出来,则相当于失去了这个时间的分辨率,只能利用原来基于规则的感知系统,只在有一些特别强的信号发生的时候,才会启动。在实际应用中,这两个极端情况都不利于真正的进行数据分析和监测,所以理想的体内低功耗的感知和计算,能够在端上利用很低的功耗做一些数据的分析加工找到一些规律,把这些符合规律的数据传出来,并且能实现五到七年以上的监测的能力。此类的微型的传感器,未来十年内会逐渐进入到我们身体的方方面面,给我们带来更高时间分辨率的高价值数据。
在我们看来,无论是更好的原始的感知,还是更好的利用多轮次、多模态,都是医疗领域发展的方向。将多种信息融合起来以后,即使短时间不能做出准确医疗诊断,也会大幅提升整个医疗诊断的效率,而这正是未来十到二十年的周期内带来新的感知机会。
在获得新数据之后,接下来的挑战就是计算了。这也是AI发展到今天在各行各业共同面对的挑战和机会。我们认为在未来20年,计算能力的快速发展,是一个我们可以去相信和利用的驱动力。其中一个角度是在云端的,或者说在不限制功耗条件下的超高速的计算。例如像我们已经布局的光学计算,利用光交叉的速度优势,而带来的新的数据处理能力。当计算的能力一步一步的达到比今天要有几十个数量级的提升,才能真正的匹配上我们人体内10到20次方个单细胞的数据量。另外一个角度,则是边缘计算能力,如何能使得在人体内或附近,以极低功耗的来实现比今天的大型的AI计算和超级计算机更高性能的这种边缘的AI计算能力。综合考虑,我们认为最终这些新的边缘和新的云端计算,会成为一个新的AI计算能力的联合体,来更好的利用刚才前面提到的数据,从而来重新分类和理解我们的疾病。第一步在我们已有的医疗规则和知识的基础上,去提高对信号敏感度的把握,使得某种变化的趋势可以被提前的感知,提前重要信号的发现。这种提前的感知除了对患者有利之外,还有利于从最开始发病到整个疾病过程中完整的数据记录。而随着数据的丰富,我们会在这个过程中逐渐对疾病的诊断有新的认知,对旧的问题重新拆分解构和聚类,从而带来新的医学突破。而AI加上前面提到的数据轴所扮演的作用就是这样的突破的燃料和引擎。未来二三十年,我们渐渐会进入一个时代,由于数据的采集成本和计算成本变得极低,各类数据轴会大量的超配。大量的医疗数据会像一个大熔炉一样,大家在这个熔炉中会继续的利用时间轴,利用对目标人群的观察,找到和发现新的规律。我们坚信未来20年会进入医疗新发现井喷的时代,带来学术研究以及科技创业的机会和曙光。
近些年大家现在也看到了生成算法发展,其在新药的发现已经有新的进展。未来随着微器官或者模拟器官技术的进步,当这个闭环能建立的时候,通过对抗生成提出假设,在体外快速检验,我们科学发现的速度会大大加速。当然生物领域、医疗领域由于受制于很多伦理的问题以及一些技术的物理限制,发展速度可能受限,但是我们认为终有一天,至少有一部分人体的数字孪生,随着感知和计算能力的高速提升,最终会变为可能。现在的工业、现在的建筑、我们的城市都在提数字孪生的概念,本质上讲就是对物理世界做完整的实时的镜像重建,意味着可以无数次模拟和测试,使得刚才提到的统一感知、统一计算,提前补偿、提前干预这件事变为可能。我们认为医疗领域长期的未来,随着技术的发展也会朝着这个方向迈进,每一个人将拥有自己的digital version。
AI跟任何一个行业的关系最终都是重塑一个生命体,医疗领域也不例外。新型的感知和计算会打破原有的边界,形成人机混合、人机高度协同混合的一个庞大的生命体。当50年或者100年后,我们回顾现在,可能会发现今天的人类,其实只是上一代的生命体。
在今天,人体内已经可以植入很多的硬件,很多是有功能型的没有决策能力的设备,也有一些基于一定规则触发的、或者是基于预设功能的设备。在未来,如果人体内植入的硬件开始有很强的自主的能力并不断的更新进化的话,是不是从某种意义上就融合成为人类生命体的一部分了呢?例如胶囊胃镜这类的具有一定的感知、决策、分型、干预的一个小的单元,当被植入到人体,并且在未来能不断更新的时候,它是不是可被认为是生命体的一部分呢?
在接下里的50年中,我们坚信可编程的植入体会实时的帮助我们解决今天的很多难题,例如这些系统会实时判断病人的给药靶点的正确与否、病人的实时药物耐受性等等。当这些都成为可能,到底人的边界在哪儿就成为了需要我们重新思考的问题。
有一项研究说,人类发明了眼镜之后,被蛇咬死的人数变少了,由于眼镜的赋能,人类在草丛中看到蛇的能力就提高了。这可以理解为人类一直在被类似眼镜的外部传感器所补偿。我们认为在30年到50年的未来,跟城市物联网一样,外部传感器会根据实际情况绕过人脑对人体某些部位进行自动补偿会是一种常态。
打个比方,我们城市的V2X,就是路侧的交通监测系统,能比任何人的肉眼提前预测车祸。虽然这个车祸物理上不可避免,但是在这个系统可以实时预警汽车,调节安全带设定,来更好的保护乘客。在这个过程中,人其实是被动的。当我们将这个系统类比到人体系统,既然这样的信息的传输和与人体的连接是一个从技术的角度讲是可行的,那么人体内一定可以有一些东西被激发,从人体的角度主动做一些补偿,比如释放一些生物激素,使人体能更加的做好迎接撞击的准备。当然这里举例的撞击是一个极限的情况,但是诸如此类的植入式传感器通过接受外部环境感知信号来对人体进行改变和补充,特别是提前的精准补偿,将能帮助减少人类的痛苦,提升人类的能力。
更进一步,我们相信随着感知计算的界限被打通,最终人类会进入一个协同进化的新阶段。随着感知、计算和连接能力的提升,这种群体协同的进化,特别是在不同人体内各种被植入设备之间的协同规划和防御、数据的传输,我们相信会越来越多的发生。人类的意识形态最终会是一个关于脑机接口和大脑联网的终级未来,同时在这个过程中狭义的生命体的边界会被打通。新生命体,或者生命的联合体会成为我们AI医疗的长期未来。
BV百度风投在医疗领域积极布局,已投资了30余家中美早期AI生物医疗技术公司及数据驱动的医疗服务公司,如:由张峰实验室创立的世界领先CRISPR诊断平台公司Sherlock Biosciences、中国科学家团队自主研发的新一代纳米孔测序平台公司齐碳科技、使用单细胞形态数据采集进行败血症精准快速检测的公司CytoVale、Harvard/MIT 个人定制化精准医疗TCR-T 疗法公司 Rootpath、高通量单细胞湿实验平台以及AI算法的药物发现平台公司Engine Biosciences、第一家在医学影像AI增强方面获得FDA批文的医疗影像公司Subtle Medical等等。
同时,今年BV联合了美敦力中国基金、动脉网共同举办了“2019美敦力中国基金·BV百度风投医疗机器人大赛“,我们期待一样愿意为生物与医疗智能贡献力量的你!
注:此内容由BV生物智能小组提供,未尽允许,不得转载。