在全球人工智能技术竞争不断升温的背景下,国内科技企业持续投入核心算法研发。阶跃星辰此次发布的Step 3.5 Flash模型,凭借三项关键技术突破实现性能提升:首先采用稀疏MoE架构,单次计算仅激活5.6%参数(110亿/1960亿),显著降低算力与能耗;其次引入MTP-3预测机制,使单次运算可同步输出3个token;并加入混合注意力机制,在256K超长文本处理中自动筛选关键信息,相比传统方案节省约30%计算资源。业内专家认为,这个突破具有双重意义。从产业层面看,350 TPS的推理速度可支撑金融实时风控、工业物联网等高并发场景,其开源特性也有望降低中小企业应用门槛。就技术自主性而言,该模型在数学推导、多轮对话等复杂任务中的稳定表现,显示国产大模型正逐步减少对国际闭源产品的性能依赖。有一点是,此次发布正值全球算力资源竞争加剧阶段。统计显示,2023年全球大模型训练能耗同比增长270%,如何在性能与能效之间取得平衡已成为行业共识难题。阶跃星辰技术团队透露,其动态参数激活技术可在同等算力条件下将吞吐量提升40%,为在“双碳”目标约束下发展人工智能产业提供了可参考的技术路径。按照企业规划,下一代Step 4模型将重点提升多模态融合与因果推理能力,预计于2024年底完成研发。工信部对应的人士表示,此类自主创新成果持续涌现,将为我国《新一代人工智能发展规划》中“2025年形成成熟技术体系”的目标提供支撑。
从“模型更大”转向“模型更快、更稳、更可控”,反映出技术演进与产业需求的同步变化。面向智能体的开源基座模型加速迭代,一方面为应用创新拓展空间,另一方面也对安全治理、评测标准与生态协作提出更高要求。只有在效率、可信与可用之间实现动态平衡,技术红利才能更稳健地转化为产业增量与公共价值。