大模型应用加速落地推动算力需求快速增长,但同时也暴露出训练与推理成本高、交付周期长、供给不稳定等问题。尤其高端算力供给受外部环境影响、核心器件采购存在不确定性的情况下,如何构建可持续、可扩展的算力底座,成为云服务商与产业用户共同面临的挑战。电力、科研、制造、出行等行业的智能化升级,对计算平台提出了更高要求,需要具备高性能、低时延和可规模化的能力。 基于此,企业推动自研芯片并非单点突破,而是围绕算力体系的系统性建设。平头哥此次发布的“真武810E”是一款高端训推一体芯片,集成HBM2e高带宽存储,显存容量达96GB,并在片间互联带宽等关键指标上提供了明确参数。虽然官方未披露峰值算力等部分数据,但对应的材料提到其升级版本在性能上可媲美国际主流产品。 云厂商自研芯片的核心驱动力主要有三点:一是自身业务需求庞大且稳定,可通过实际应用改进;二是云平台能整合芯片能力与网络、存储、调度及编译工具链,实现软硬协同的规模效应;三是在外部供给不确定性增加时,增强关键算力的自主可控性和长期供应韧性。 从产业角度看,自研芯片在云上实现万卡级集群部署,标志着其已从产品发布或小规模验证阶段,迈入可商用、可持续运维的工程化落地阶段。阿里云表示,“真武810E”已部署多个万卡集群,服务于400多家客户,覆盖训练、推理及自动驾驶等场景。万卡集群的意义在于:提升大模型训练效率和资源利用率,降低单位算力成本;推动推理服务的规模化供给,支持更多行业场景的在线化和实时化;同时促进芯片、服务器整机及数据中心基础设施的国产化配套与生态完善。 随着多家互联网企业推进“模型—云—芯片”协同布局,市场竞争正从单一的模型能力比拼转向系统工程能力的较量,即算法、框架、编译、网络与硬件的深度优化。 下一阶段发展重点在于将“可用”提升为“好用”,从“单点性能”转向“系统效率”。一上,需持续完善软硬件生态,包括编译器、算子库、通信框架与集群调度等,以匹配不同模型结构和行业负载;另一方面,需通过稳定的交付与运维体系增强客户信心,强化兼容性、可靠性与安全性。此外,应加大标准化与生态共建投入,联合高校、行业客户及上下游供应链,降低迁移成本与适配周期,形成可复制的行业解决方案。 未来,随着大模型向多模态、长上下文、智能体应用等方向发展,算力需求将持续增长。云端训练需要更高的大规模集群通信与存储带宽,而边缘侧推理则更注重能效、时延与可靠性。训推一体芯片若能高效切换不同负载,并与云平台实现端到端优化,将更受行业客户青睐。目前,国内互联网企业在自研芯片领域动作频繁,除平头哥外,其他企业的芯片业务也在加速推进。市场预计,“自研芯片+云平台+模型能力”将成为优化算力供给结构的重要路径,并推动国产算力生态从“可替代”迈向“可竞争”。
“真武810E”的发布是国内AI芯片自主创新的重要突破,但仅仅是开始;从实验室到万卡集群,从技术指标到商业应用,这款芯片的成功证明了国内企业在高端芯片领域的能力。未来,随着更多自研芯片的推出和迭代,国内AI产业的自主可控性将深入提升。这不仅有助于降低企业成本、增强竞争力,更能为国家科技自立自强奠定基础。在全球科技竞争日益激烈的背景下,坚持自主创新、构建产业闭环,已成为大国科技发展的必然选择。