北京1月9日消息,清华大学智能产业研究院的兰艳艳教授,带领生命学院、化学系的团队,在新药研发的关键环节搞出了大动静。他们用AI把药物筛选效率提升了百倍甚至更多,而且第一次把人类基因组里的潜在药物靶点给系统性地筛了个遍。现在全球生物医药界面临个大难题:已知的药物靶点有好几万个,可现有的技术手段能有效探索的就占个10%。传统的筛选办法虽然有必要,但那计算量跟耗时长让人头疼,根本没法快速找出有用的苗头分子。 举个例子,如果用现在的技术去筛1万个蛋白靶点,那计算量简直是天文数字。哪怕用顶配的电脑一直不停转,也得耗上几百年。清华团队这次想出了新招,把自然语言处理里的“语义检索”思想引进来。他们把复杂的三维结构对接给简化了,直接变成向量空间里的相似度比对。这一改变让大规模并行计算成了可能,效率一下子就飞了起来。 据了解,这个“DrugCLIP”平台用一台带128核CPU和8张GPU的机子就能干。它一天能把万亿级别的蛋白口袋和小分子配对给算出来打分,效率比老法子高了百万倍。这就意味着过去几百年的活儿现在一天就能干完。更牛的是,这个平台把从预测蛋白结构到找活性分子的整条链子都给打通了。 靠着这技术,团队干了件前所未有的事:在全球范围内搞了个覆盖人类基因组规模的虚拟筛选。他们筛了1万个蛋白靶点、2万个蛋白口袋,还分析了5亿多个类药小分子。最后找到了200万个潜在有活性的候选分子。 为了让大家都能用上这份宝贵资源,这个巨型数据库已经免费对全球开放了。在线筛选服务也上线了,只要给特定的靶点或口袋下命令就行。 数据显示平台上线半年后,已经给全球1400多个用户做了超过13500次筛选任务。 这项成果刚在《科学》杂志上发表没多久就火了。专家都说这事儿意义重大,AI不再是个辅助工具了,成了驱动源头创新的引擎。 兰艳艳团队说未来还要多跟国内外合作,去攻克肿瘤、传染病这些大病难题。 这个突破说明咱们在新药研发的“最上游”环节已经走到国际前列了。