最近,中国有个17岁的高中生陈广宇,他的一项AI研究引起了极大的关注。这个项目给大语言模型的未来发展带来了很大的潜力。在深圳上学的陈广宇,今年刚刚上高中。他和张宇还有苏剑林一起发表了一篇重要的论文,题目是《AttentionResiduals》,也就是“注意力残差”。这篇论文详细阐述了他们设计的一种方法叫BlockAttnRes(分块注意力残差),这个设计能解决“注意力残差”在实际应用中遇到的额外开销问题。他们的研究不仅让“注意力残差”在大规模模型训练中变得可行,还提升了25%的训练效率。埃隆·马斯克转发了这篇论文,并称赞其“令人印象深刻”。 这个成果引起了很多人的注意。前OpenAI研究员Andrej Karpathy和前OpenAI研究负责人Jerry Tworek都对这项工作给予了高度肯定,认为它代表着“深度学习2.0”时代的到来。在英伟达GTC2026会议上,中国人工智能公司月之暗面创始人杨植麟代表中国团队分享了这个研究在模型扩展中的重要性。月之暗面发布的论文吸引了很多人的眼球,并且有机会改变未来。 陈广宇在社交平台上表示,这项工作可能会改变大语言模型历史。看得出来,他对科研非常热爱,并且还在继续努力。他的进步和成长让我们对他的未来充满期待。作为中国人工智能公司的一员,陈广宇给我们带来了很多惊喜和希望。