摩尔线程6.6亿大单拿下夸娥集群

3月30日晚，摩尔线程搞出了个大新闻，直接把6.6亿的大单给揽进了怀里，拿下了这个夸娥（KUAE）智算集群项目。这家公司靠这次的出手，给国产GPU敲了一下警钟：万卡时代，真的来了。这笔高达6.6亿元的大单，是国产GPU厂商第一次拿到这么大规模的智算集群订单。更让人想不到的是，摩尔线程居然直接把英伟达在万卡级训练市场的霸主地位给打破了。为啥说万卡集群对国产算力这么重要呢？因为这可是支撑万亿参数大模型训练的基础装备，相当于AI算力界的“皇冠”。以前国产GPU老是卡在单卡很强，但是一上集群就不行的怪圈里——单卡算力跟A100差不多，但想让上万块GPU稳定地运行在一起、保持高的训练效率和连续性，这一点国产厂商就一直比不过别人。夸娥集群这次最大的突破就是攻克了工程上的难关：它支持成千上万个GPU一起跑，训练的效率能达到95%，真的干活的时间超过了90%。这下好了，国产GPU终于把“能用”的阶段给抛在了身后，真正实现了“好用”，现在完全有能力接下那些超级大的AI训练任务了。虽然公告里没写客户是谁，不过大家心里都有数，估计就是互联网巨头或者国家级的智算中心。这其实就是市场在用脚投票选谁家的方案好用。对比华为昇腾和寒武纪，这两家以前主要还是干推理或者是中等规模的训练活儿。摩尔线程这次直接杀进了最核心的万卡级训练领域，这标志着国产GPU终于在高性能计算这块最难啃的硬骨头里完成了商业化落地。现在国产GPU市场分成了三股势力：摩尔线程主打通用GPU，他们的MUSA架构能兼容CUDA，夸娥集群主要就是为了万卡训练设计的。这一次拿到的6.6亿订单验证了他们把整个系统都搞定的本事。寒武纪那边搞的是全栈AI芯片思元系列，业务覆盖了云边端各个地方，手头的百亿级智算订单不少，但他们的训练场景还是偏中小型。华为昇腾做到了100%国产化，昇腾910B集群在政务和金融领域用得挺好，但生态开放度相对就弱一点。这次大单出来以后，摩尔线程在高性能训练集群这块的领先优势就更大了。对整个行业来说这意味着什么？最明显的一点就是国产替代开始往深处走了。以前主要靠政策推着走，现在市场开始主动挑国产方案了。到2026年国产算力份额估计能冲过60%。另一个大变化就是万卡时代正式开启了。夸娥集群落地后给国内的智算中心和大模型公司提供了自主可控的算力底座。还有就是产业链终于等到了业绩兑现的好日子：芯片、服务器、液冷、光模块这些环节都能沾光赚钱，AI算力基础设施要进入规模化落地期了。总结一下：这个6.6亿的订单不光是终点更是起点。在AI算力成了新的核心生产力的今天，摩尔线程的突破不光是一家公司的胜利，更是中国在算力自主可控上迈出的关键一步。