MetaGraph,被誉为“DNA谷歌”,是一款能够快速筛选公共数据库中海量生物数据的搜索引擎,相关研究成果发表于《自然》杂志。这款工具能够处理包含千万亿级DNA碱基的数据,相当于拍字节的信息量,超越了谷歌索引中的所有网页。与YouTube搜索引擎类似,MetaGraph无需提前对基因模式进行明确标注,就能找到隐藏在庞大测序数据集深处的模式。它的开发初衷是解决测序数据集的可及性问题,通过数学“图谱”将重叠的DNA片段连接起来,实现高效检索。研究团队整合了7个公共资助数据库的数据,构建了一个涵盖病毒、细菌、真菌、植物、动物和人类的序列集,并开发了一款搜索引擎,用户可以通过文本提示检索这些数据。为了证明其实用价值,研究团队利用MetaGraph对全球241384个人类肠道微生物组样本进行了检索,以寻找抗生素耐药性的基因标志物。这项技术为生物学研究开辟了新的领域。