阶跃星辰开源Step 3.5 Flash模型推理速度达350TPS助力智能体开发

在全球人工智能技术竞争不断升温的背景下，国内科技企业持续投入核心算法研发。阶跃星辰此次发布的Step 3.5 Flash模型，凭借三项关键技术突破实现性能提升：首先采用稀疏MoE架构，单次计算仅激活5.6%参数（110亿/1960亿），显著降低算力与能耗；其次引入MTP-3预测机制，使单次运算可同步输出3个token；并加入混合注意力机制，在256K超长文本处理中自动筛选关键信息，相比传统方案节省约30%计算资源。业内专家认为，这个突破具有双重意义。从产业层面看，350 TPS的推理速度可支撑金融实时风控、工业物联网等高并发场景，其开源特性也有望降低中小企业应用门槛。就技术自主性而言，该模型在数学推导、多轮对话等复杂任务中的稳定表现，显示国产大模型正逐步减少对国际闭源产品的性能依赖。有一点是，此次发布正值全球算力资源竞争加剧阶段。统计显示，2023年全球大模型训练能耗同比增长270%，如何在性能与能效之间取得平衡已成为行业共识难题。阶跃星辰技术团队透露，其动态参数激活技术可在同等算力条件下将吞吐量提升40%，为在“双碳”目标约束下发展人工智能产业提供了可参考的技术路径。按照企业规划，下一代Step 4模型将重点提升多模态融合与因果推理能力，预计于2024年底完成研发。工信部对应的人士表示，此类自主创新成果持续涌现，将为我国《新一代人工智能发展规划》中“2025年形成成熟技术体系”的目标提供支撑。

从“模型更大”转向“模型更快、更稳、更可控”，反映出技术演进与产业需求的同步变化。面向智能体的开源基座模型加速迭代，一方面为应用创新拓展空间，另一方面也对安全治理、评测标准与生态协作提出更高要求。只有在效率、可信与可用之间实现动态平衡，技术红利才能更稳健地转化为产业增量与公共价值。

阶跃星辰开源Step 3.5 Flash模型 推理速度达350TPS助力智能体开发

阶跃星辰开源Step 3.5 Flash模型推理速度达350TPS助力智能体开发