大家好,我们知道谷歌的DeepMind又搞了个大新闻。这一整月的时间里,他们在1月30日把团队研发出的AlphaGenome模型给推出来了。这东西有多厉害呢?它能帮咱们把基因里的DNA给解码,特别是那些不能直接变成蛋白质的非编码区。大家可能都知道,咱们的基因里只有2%的DNA是负责编蛋白质的,剩下那98%虽然不干活,但却是调控基因表达的关键环节。之前很多研究因为分析这些非编码区域太费劲,导致数据太长的时候精度就掉下来了。这次的AlphaGenome就是专门为了攻克这个难题而生的。 研究人员给模型喂了大量的人类和小鼠基因组数据,让它学会了DNA里那些看不见的“语法规则”,还能一次搞定长达100万碱基对的长序列分析。而且这时候它能一口气预测出好多种遗传信号,包括基因表达水平、RNA剪接模式还有蛋白质修饰之类的。论文里的数据也很能打,在26个不同的基准测试里,它在25个方面都把现在最先进的专业模型给比下去了。 这就意味着以后科学家分析基因组变异的效率和广度都能大大提高。业内的专家说,AlphaGenome能帮大家把非编码区这块“暗物质”给掀开来看清楚。对病人来说,它能帮医生解释清楚那些不明原因的变异是咋回事;对搞药的人来说,还能帮他们找到新的治疗靶点。DeepMind团队表示,以后还会继续优化这个模型,让它能分析更多物种或者别的类型的非编码序列。 随着这类工具越来越好用,咱们对自己基因密码的理解肯定会越来越深。科学探索这事儿永无止境嘛,现在人工智能又给生命解码的事儿添了一把火,新的篇章也就这么开启了。