商务合作
动脉网APP


一、产品名称
百图生科生命科学基础大模型
二、产品领先性/创新性
BioMap百图生科是全球生命科学基础大模型的先行者,通过2100亿参数的跨模态生物语言大模型,构建高质量的生命科学AI任务模型。
三、产品介绍
作为全球最早专注于生命科学基础大模型的平台公司,自2020年成立以来,百图生科始终致力于在这一高难度技术平台上取得突破。生命科学基础大模型,并非自然语言大模型+生物学文本的垂直应用、垂直“大模型”,而是围绕生命科学的氨基酸、碱基等高复杂序列数据,开发一套与自然语言基础大模型理念相近,但技术完全不同的基础大模型底层技术,从Transformer到训练框架,再到更关键的数据集与验证闭环,都与自然语言大模型截然不同、更加挑战、更加前沿。与生命科学多样化具体任务结合,理解和对齐复杂的生命科学组学数据,理解生命科学规律并建立基础图谱,建立生命科学行业原有数据规模百倍以上的超大规模数据集——这些都是过去四年间,生命科学基础大模型先行者们所面对的挑战。
四、产品创新性
底层技术:xTrimo千亿参数跨模态生命科学基础大模型
技术亮点
1、领先的模型架构:业界首个千亿参数级的MOE(Mixture of Experts)架构生命科学大模型,结合序列并行与上下文并行技术,支持长序列处理(可达512K),实现了生命科学长序列的全覆盖。
2、全模态的模型覆盖:覆盖DNA、RNA、蛋白质、细胞、小分子、生物影像和科学文献等多个生命科学模态,模型家族的参数规模已达到2100亿。
3、海量数据的知识提取:基于BioMap自主构建、整合、生产的万亿级别生命科学数据图谱,其中蛋白质序列、蛋白质相互作用、细胞基因表达、RNA序列、基因组等数据均达到数十到数千亿条。
4、高性能AI基础设施:依托万卡级高性能GPU集群,通过高效弹性调度和虚拟化技术,全面优化了千卡级大规模训练任务,实现了99%的训练效率。
五、临床与应用价值
百图生科打造的200余个AI模型,已先后助力开发了20余种前沿抗体和酶、实现了10余个创新靶点的挖掘,并都经过了实验验证,推动进入临床前研发等后续阶段。AI模型驱动的高通量自动化流程,覆盖从分子生成、实验验证、闭环迭代的完整链路,大幅提高合作客户的研发效率,缩短研发周期
六、发展潜力
xTrimo基础大模型平台上,目前已有200余个任务模型取得评测SOTA水平,在药物研发中涉及通用蛋白、多种构型的抗体、细胞疗法、基因疗法等多个领域,以及靶点发现、工艺优化、合成生物学、生物制造、生命科学工具等多样的方向。基础大模型的贡献,并不在于能以单一技术、一己之力解决前沿问题,而是在面对多样化、缺乏数据的前沿问题、缺乏泛化能力的现有模型时,能够利用千亿参数和万亿数据中蕴含的知识,进行embedding赋能,为难解之题带来一些来源于十亿年生物进化树上的高维信息。
七、行业潜力
百图生科是国家高新技术企业、北京市独角兽企业、北京市“专精特新”中小企业、工信部APEC创新之光优秀成果奖、中国科协第四届颠覆性创新榜十强以及数博会优秀科技成果奖,还获得了wef全球技术先锋企业,入选「AI 中国」机器之心2024年度评选“ScienceAI领军企业 TOP 10”,入选甲子光年「甲子20」“2024中国AI大模型领域最具商业潜力榜”,入选量子位“2024人工智能年度领航企业”,入选36氪“WISE2024商业之王年度最具商业价值企业”等榜单。

百图生科
创新药物研发平台开发商
申请日期 | 专利名称 | 专利类型 | 状态 |
|---|
2023-04-21 | 单粒子图像处理方法、装置、电子设备和存储介质 | 发明专利 | 公开 |
2023-03-28 | 用于确定吞噬细胞吞噬能力的方法、装置、设备和介质 | 发明专利 | 实质审查 |
2023-03-13 | 细胞激活状态确定方法、装置、电子设备及存储介质 | 发明专利 | 实质审查 |

百图生科
创新药物研发平台开发商



