作者:武瑛港 李宇凝
8月13日,工业和信息化部正式发布《人工智能在生物制造领域典型应用案例(第一批)》。
案例共涉及16家企业院所,包含北京昭衍生物、上海天鹜科技、百图生科、上海智峪生科等,均是生物制造领域较为知名的企业院所。
近期AI+生物制造似乎已经成为行业风口,国家级政策接连不断。
此前工信部和中国科学院办公厅联合发布《关于开展高性能生物反应器创新任务揭榜挂帅工作的通知》,重点提及智能工业操作系统。7月31日,国务院常务会议审议通过了《关于深入实施“人工智能+”行动的意见》。
产业端同样热闹非凡。6月25日,自主智能体企业镁伽科技拟赴港上市,战略布局合成生物;6月26日,前中国首富钟睒睒以34亿元联手锦波生物,押注AI+合成生物。
AI与生物制造似乎具备天生的适配性,但在AI如此火热之时,值得思考的是,AI到底能赋能生物制造哪些场景?哪些可为、哪些不可为、哪些大有前景、哪些仍需谨慎?
对此动脉网在调研访谈中了解到,AI在生物制造领域的应用主要包括:挖酶(新酶发现)、改酶(酶序列优化)、造酶、细胞工厂代谢优化、实验室自动化和工艺优化等。
其中AI在挖酶、改酶和工艺优化方面的效果较为突出,例如对于改酶,大多企业在半年至一年内即可直观、快速地看到效果,但是借助AI为指定的反应造酶较为困难,难度可能会达到诺贝尔奖级别。
对于借助AI优化细胞工厂的代谢,已经有企业在尝试和探索,但是因为细胞的代谢网络极其复杂,所以尚缺少优质的虚拟细胞模型;实验室场景的AI应用难点则是在于流程非标准化,需要频繁进行人工判断和决策,但AI尚难以替代人工。
01.
挖酶与改酶:半年至一年即可看到效果
挖酶和改酶是AI应用相对成熟的环节。
在智峪生科董事长、CEO王晟博士看来,当前AI在生物制造领域较为成熟的应用就是“三板斧”:寻路(设计生物合成路线)、挖酶、改酶。未来如果AI足够强大,甚至有希望根据化学反应直接创造一个自然界不存在的酶。
其中挖酶即根据特定反应步骤,从已知蛋白质序列数据库中挖掘相应的酶,类似于“智能化的搜索引擎”。
据王晟介绍,当前人类对已知蛋白序列的收集已超过十亿条,挖酶的实现方法就是借助AI,从庞大的蛋白质序列数据库中挖出有限数量的有潜在指定功能的蛋白质序列,并依赖DNA 合成与分子克隆技术,最终在生化实验中验证催化合成反应的效率。
改酶则是现有或挖到的酶表现不够好,或者达不到工业生产的需求,例如底物转化率不够高、活性不够强,或者酶热稳定性、可溶表达量等属性不达预期,甚至在更有挑战的场景下需要改变酶的产物或者底物的选择性,那么AI生物计算技术可以根据目标属性对酶进行改善。
“具体方法是通过AI算法沟通‘序列-结构-功能’的关系,寻找影响酶功能属性的关键氨基酸,进行指定方向的突变。传统定向进化方式主要利用大量饱和突变,对于酶改造依然有效且被广泛采用,但效率较低、周期长,借助AI会大幅提高效率。”王晟指出。
对于改酶,据百图生科生物制造解决方案主任专家罗朝晖进一步介绍,传统实验室改酶一般需要两轮:第一轮做定向修饰,改善酶活;第二轮改善耐热、耐酸性、耐碱等工业化应用属性。
但是在第二轮修饰酶的氨基酸序列或蛋白质结构时,可能会影响第一轮的效果,最终得到工业属性突出但活性很低的酶,或者两者都不具备,那么传统方式就需要不断实验和尝试。
所以改酶的主要难点在于:能否以尽可能少的实验探索出一条最优路径。
“而AI的优势就在于可以同时结合酶活和耐热等属性,对不同路径模型进行调优和打分,找到综合评分较高的路径。”罗朝晖表示。
“AI大模型可以学习现有已知所有蛋白质的序列或结构,学习不同酶的特点和骨架设计,还可以把多个大模型同时打包进蛋白设计智能体的设计工具中,同时调用不同模型,对酶改路径进行打分。”罗朝晖进一步指出,之后企业再针对这些路径到实验室进行测试,就可以更高效地得到属性均衡的酶,这一过程通常半年到一年就能看到不错的实际效果。
但是改酶不论对生物制造还是AI,似乎都属于较为初级的应用。
在王晟看来,当前AI对酶的价值类似“搜索引擎”,功能发挥不够,未来一定要从“搜索时代”上升到“造酶时代”,即给出化学反应就能造出一个能实现催化的酶,这才能给产业带来翻天覆地的变化。
02.
造酶:难度或堪比诺奖级别
“如果只是随意造出一个酶,很多企业都可以做到,但如果是为任意一个化学反应来创造催化酶,全球能做到的人屈指可数,且基本无法实现工业化应用,所以只能先退而求其次,用AI来挖酶和改酶。”王晟表示。
据王晟介绍,造酶难度非常大。当前化学合成技术已经非常成熟,几乎是“天下万物皆可化学合成”,只要给定需要合成的物质的分子式,化学专家就都可以通过各种方式实现合成,但是不少反应都不够高效或者污染严重。
这时能否借助AI有针对性地造酶,让反应更绿色高效地实现?
王晟指出,目前自然界现存能实现催化的酶,数量并不多。因为酶通过千百万甚至数亿年的天然进化,已经非常漂亮和高效,但大多只能在常温常压环境下发挥作用。
“未来人类有望结合系列化学反应方程式直接设计出酶,可能不一定必须由20种标准氨基酸形成,甚至可能都不是传统意义上的蛋白,但就是能催化反应。”王晟表示。
“但是造酶挑战非常大,难度可能会达到诺贝尔奖级别。”王晟指出。
不过在罗朝晖看来,借助高通量技术其实可以一定程度上实现从头设计酶,并保证一定的成功率。
罗朝晖分析称,让 AI大模型基于对当前对蛋白质的理解,创造一个全新的有特定效果的蛋白序列和结构,挑战很大,但目前取得的成果也同样值得肯定。
据介绍,酶改的成功率甚至可以达到30%-40%,因为AI可以在反馈过程中不断学习,后续会设计得更好、更精准。“但从头设计一个酶需要通过验证数千个目标才能让 AI逐步学习并迭代,进而得出更好的结果。”
要想真正实现造酶,据王晟分析,还要在以下四方面继续突破:
第一,理论化学还需要完成一些研究,但不用太多;
第二,酶催化的本质与量子力学有关,但当前科学对量子化学和生物催化结合的探究还不够;
第三,需要打造AI模型,能够刻画化学反应最底层的信息,这涉及动态反应势能、电子转移、化学键形成和断裂过程、过渡态刻画等,可能必须通过量子化学才能描绘,但这些步骤如何用AI语言来描述和理解,目前还没有任何一个算法能够做到;
第四在于验证,哪怕初步的AI模型诞生,根据一个化学反应设计出数十万个蛋白质序列后,其中可能只有一条序列能够催化反应,那么该如何进行高效验证,同样是困难所在。
虽然富有挑战,但是在罗朝晖看来,只有通过AI大模型才更有可能实现从头设计酶。
在AI大模型出现之前,从头设计一款酶几乎不可能,因为工程量过于庞大。
“从头设计蛋白质序列与结构时,AI要从天马行空的百万数量级的突变中筛选出1000多条蛋白质序列与结构,经过实验室验证后,其中可能只有5 条、10 条勉强过关,这时AI就要基于上一轮的学习,再重复一轮从百万可能性中筛选出5至10条的流程,成功率才能越来越高,这样的工作模式和工程量,过去靠人工、人脑设计就是不可能的任务。”罗朝晖表示。
除了工程量,高昂的成本同样是难题。
据罗朝晖分析,AI筛选出数千条蛋白质后的测试和验证已经是不小的成本,但这一过程可能需要重复5 ~ 10轮,AI 才可能真正设计出高价值蛋白质,整体成本巨大。
如果未来行业数据量积累足够,能够将成本从上千万降低到一两百万,同时AI 模型越来越精准,不仅能设计出全新酶分子,还能同时保证酶活以及耐温性等工业性能,这样才能得到市场的青睐。
但是在罗朝晖看来,设计新酶的数据环境已经正在改善。
此前这类数据多来自药企,因为药企的早期研发实验室通量较高,高产量设备相对齐全,一次就可造出数千条不同的蛋白质,从头设计酶的案例也大多是药企在尝试。
但从2024年开始,越来越多的农牧、食品等传统生物制造企业也开始布局合成生物学实验室,配置越来越多的新设备,投资金额和通量都越来越大,数据的积累也越来越多。
“总而言之,AI 大模型的出现为生物制造开创了未来,为创造出大自然中不曾存在的蛋白质新结构带来了可能性。”罗朝晖表示。
03.
细胞工厂:代谢网络极其复杂,尚未出现优质AI模型
AI在细胞工厂方面也有广阔的应用前景。
细胞工厂即对底盘细胞改造后,可以造出特定化学品和蛋白质的微生物。
王晟表示,很多合成生物产品都是通过细胞工厂生产,但是对细胞工厂的改良和打造仍然依靠传统方法,即不断敲掉DNA的不同片段,或者不断引入不同的外源序列,再或者通过大量随机诱导突变,再结合高通量筛选,虽然也有不少科学依据,但本质上更像是依靠不断试错来找到正解。
AI似乎可以提高“不断试错”的效率,但是当前尚无细胞工厂的垂直大模型出现。
据王晟分析,细胞工厂的核心是代谢网络和通路,其实人类一直想在细胞工厂方面有所突破,但大多只停留在学术层面,例如近年很火的虚拟细胞“virtual cell”,本质就是希望通过AI模型来理解、描绘和预测细胞的代谢网络。
“就像Alpha Fold2横空出世后,人类才能掌握序列蛋白的结构和功能之间的关系,但是在细胞工厂领域还缺少对应的算法和模型,或者远未达到类似AlphaFold2的级别,也就很难预测细胞工厂的代谢网络。”王晟表示。
罗朝晖也表示,整体虚拟细胞的构建是AI下一阶段的研发目标。
“现在已经有DNA、蛋白质、生物制造工艺等大模型,我们可以根据客户的需求来组合模型,打造定制化的垂直领域智能体,例如要提高某个产品的产量,就可以将DNA、蛋白质和系统工程等模型组合在一起,帮助设计整套工作流。”
其实组合模型的方式一定程度上也可以适用于细胞工厂。
据罗朝晖分析,构建细胞代谢通路优化的智能体,需要花费大量时间调用不同模型进行组合和优化,每次都需要重新构建。
所以希望通过AI降低成本,但细胞工厂的智能体构建非常依赖专业人工研发团队,需要AI 科学家、生物科学家等一起讨论和定制。
“所以最好的方式是单独推出细胞工厂的大模型,前提一定是先百分百构建出虚拟细胞模型,一旦出现,就可以单独成为智能体来改善细胞代谢状态,满足客户各种需求。所幸的是,我们公司在虚拟细胞模型方面也取得了成果。”
据了解,与酶不同的是,细胞工厂的代谢网络极其复杂,代谢可能涉及到十余种酶,同时涉及 DNA 转录、逆转录和代谢,是个系统工程模型,而且细胞工厂的改良目标往往是用最少的物料、最短的时间、产出更多的结果,这就进一步提高了难度。
而AI只有充分理解了这一网络,才能建立大模型,真正赋能细胞工厂。
王晟指出,细胞工厂几乎相当于一整个生命体,其代谢网络不仅包含了蛋白质之间的互作网络,还有蛋白质与核酸、蛋白质与小分子的互作网络等。
而且代谢网络会随外界因素变化而变化,细胞在小型、100升以及100吨的发酵罐中的代谢状态完全不同,这与细胞密度、环境温度、pH值、搅拌转速以及氧的分布等各种因素相关,细胞工厂放大难的问题也正在于此。
“只有AI才能理解和预测细胞工厂的代谢网络,但AI在这方面的赋能程度还不够,缺少优秀的建模。”王晟表示。
正因为如此,王晟认为AI在酶方面的应用,短期内一定优于细胞工程,而且更可控和高效。
“因为酶在一升和一万升发酵罐中的效果可能基本一致,我们挖的酶、改的酶在小反应中的两小时转化率为99.8%,在用于生产的10吨大发酵罐中也是同样的效果。因为酶来源于细胞,本质是催化剂,化工催化剂较少出现放大难的问题。”
“但是如果想要做到生物制造成本比化工方式更低,几乎只能靠细胞工厂,但是当前对细胞工厂的改良可能还是要借助传统试错方法来完成。”王晟表示。
04.
实验室场景:智能化程度不高,难以替代人工决策
实验室智能化也是AI的重要应用场景之一。
根据动脉网行研报告,实验室自动化与数智化发展仍处于早期阶段,距离实现“黑灯实验室”的终极愿景尚有长路,但已展现出潜力,有望成为推动产业跨越式升级的重要驱动力。
那么AI在其中到底能发挥多大的作用?
上海曼森生物科技有限公司创始人、董事长郝玉有表示,首先要区分自动化和智能化,这是两个不同的概念。
实验室自动化是替代重复性体力劳动,可以分为三个层面:第一层面是单一功能的自动化,只解决某个动作;第二层面是工作站,解决组合性动作自动化;第三层面是流水线,解决整个流程的自动化,有待完善和发展。
相比之下,实验室智能化的关键是替代脑力劳动,自动实现需要思考和判断的工作。但自动化是智能化的前提条件,智能化可能需要自动化技术来支撑。
在郝玉有看来,实验室的自动化和智能化程度目前都不算高。
据郝玉有分析,当前工厂生产环节的自动化程度很高,但实验室的自动化程度远远不够,尤其在生物制造领域,实验室人员远多于生产线人员,实验室内大部分仍是人工操作。
当前问题在于,实验室自动化的每一步都需要人工参与,工作人员一个月内在操作方面花费了大量时间。智能化的程度比自动化更低。
因为和制造业相比,实验室的操作过程非常不标准,完成一步后,下一步是否要做、如何做,完全依赖人工判断,所以需要实验室人员至少本科起步,而实验室的智能化难点也正在于此——需要替代科研人员来判断和决策。
近日美国知名科技研究机构Lux research也发文指出,在AI帮助下,实验室自动化确实可有效提高通量和可重复性,但通常需要依赖人类监督、解释数据和规划下一步。
而且许多专业人士认为实验设计的核心在于人类的解释与创造力,这一决策过程AI目前无法复制,因此当前的AI并非实验室自动化的基本必需品。
在郝玉有看来,AI想要契合实验室场景,最关键要解决人才问题。
“过去十来,产业界已经把大量资金投入实验室的自动化和智能化方面,但很多都以失败告终。因为卡脖子之处并不是技术和资金,而是对实验室具体场景的理解,以及理解以后的转化,将场景操作转化为智能化技术。”
“所以能实现实验室自动化和智能化的关键人才,可能已经不是自动化专家,而是在实验室中有丰富经验和深刻了解的复合型人才,能将实验室需求翻译成软硬件的表达和语言。”
另外自动化和智能化一定要以数据为核心。
郝玉有指出,实验室追求的并非单纯高通量、高效率,“不是一天完成了多少试验,而是要把数据做得更可靠、更准确,同时把人解放出来。而且AI在实验室的应用也一定是以数据驱动,智能制造本质上就是获取了操作过程中的各种维度数据,基于这些数据驱动后续操作和决策。”
05.
工艺优化:部分应用可能比改酶更加成熟
工艺优化是生物制造的关键环节,甚至可能决定了产品能否规模放大和量产。AI在工艺优化环节的应用主要在于两方面。
一方面是借助AI来设计生物合成路线,进而得到最终产物,王晟称之为“寻路”。
王晟表示,生物合成的路线设计必须借助AI,因为如果只是通过传统数据库检索,就很难跳出之前已存在的合成路线,而且只有人类发现过这一路线,才可能找得到。
“相比之下, AI具备强大的设计能力,通过训练数据、学习分子特征,可以根据给定的起点和终点,天马行空地设计出一条合成路线,这一路线可能从未在文献中出现过,但是在专家看来,或许还真的可行。”
另一方面在于在规模放大过程中的工艺优化。
罗朝晖认为,现在AI的应用正逐渐从蛋白设计和细胞工厂等早期研发阶段,跳转到中试和大生产等后期环节。
传统的物理、化学反应路径相对较清晰,通过传统机器学习方法建立模型就能完成优化。但是生物制造属于大规模的生物过程,依赖细胞表达,而细胞代谢本身存在较多不确定性,类似黑箱,其中涉及复杂的参数种类,而且数据量极大、波动多,其中的物理化学反应也没有那么直接,这就恰恰非常适合AI介入。
罗朝晖进一步指出,过去大家认为 AI难以用于生产,是因为传统生物制造工厂的数据量根本不够训练 AI 模型,而且过去非常依赖老工程师、老发酵师傅,他们基于经验大概知道参数如何调整,有自己的一套逻辑,类似黑箱,依靠个人主观经验。
“但现在新式工厂越来越多,甚至能够通过实时在线检测设备提高数据采集的类别、总量和质量,这样的数据足够训练AI 模型,可以通过成功或失败试验的数据不断学习和迭代,进而给出参数调整等建议,优化生产效率,这会成为未来的应用趋势。”罗朝晖表示。
王晟同样认为,AI在生产工艺的系统管理方面能起到很大作用,可以通过压力、温度、pH以及溶氧等传感器对发酵过程和代谢产物量进行实时监控,这也是智峪生科公司正在开发的重点方向。
据王晟分析,在分离纯化过程中,AI可以发挥两大作用:
一是小试、中试时,通过AI计算出潜在的优秀工艺方案,但最终仍需尝试才能确定。
二是在实际生产过程中, AI对生产进行实时监控并给出智能决策,若在无人值守时出现故障,只要传感器配置足够丰富,AI就能在第一时间让危险和损失降到最低,例如压力过高或温度过热可能会让反应不可控,那么就给AI附加条件,遇到类似情况直接关闭机器,这些对AI的能力要求可能没有改酶那么高,应用可能比改酶更加成熟。
AI在工艺优化方面的应用确实已有案例,例如Pow.Bio平台通过AI增强来分析揭示生物工艺变异源头,提前预警生物反应器条件变化导致的潜在突变。
据Lux research分析,在生物制造的工艺优化环节,AI可以在大数据集中检测细微关联、跨操作范围泛化,并实时调整控制策略,可以增强传统工具的效果。
但是矛盾点在于,对于大多数工业应用而言,生物工艺优化也可以在无需AI 的情况下,通过传感器有效进行,尤其在运行条件稳定或在已知范围内变化时。
如果 AI 在生物制造工艺中的进展能够超越模式识别,发展为整体性、前瞻性控制系统,能够检测并应对污染或代谢等方面挑战,才能对生物制造过程变得至关重要。
“AI用于生物工艺优化很可能在未来两到三年内变得越来越必要。”Lux research指出。

















