阶跃星辰开源Agent基座模型Step 3.5 Flash 适配多家国产芯片加速应用落地

当前，大模型应用正从探索阶段向规模化部署转变，但高推理成本和芯片适配复杂度仍是制约因素。阶跃星辰此次发布的Step 3.5 Flash模型，正是针对该现实需求的创新回应。该模型采用稀疏混合专家（MoE）架构设计，每个token仅激活约110亿个参数，而总参数量达1960亿。这种设计在保持模型能力的前提下，明显提高了推理效率。在单请求代码类任务上，最高推理速度可达每秒350个token，相比同类产品具有明显优势。这意味着开发者可以用更低的成本获得更快的响应速度，为实时Agent工作流应用提供了更可行的技术方案。值得关注的是，模型发布后迅速获得产业链上游的响应。华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥等多家芯片厂商已率先完成适配。这种快速的生态响应，反映出业界对高效推理模型的迫切需求，也表明了开源模型在产业协同中的重要作用。从更深层看，这一进展源于阶跃星辰去年7月发起的"模芯生态创新联盟"。该联盟汇聚近10家芯片及基础设施厂商，致力于打通芯片、模型与平台之间的技术壁垒。通过联合优化，可以提升算力利用效率，降低企业和开发者的综合应用成本。这种模式突破了传统的"各自为政"局面，形成了芯片厂商与模型厂商的良性互动。业界普遍认为，随着推理模型成为大模型应用的主流形态，模型与算力的深度协同将成为推动产业规模化应用的关键路径。Step 3.5 Flash的推出和快速适配，正是这一趋势的具体体现。通过降低推理成本和应用门槛，更多企业和开发者将有机会参与到大模型应用创新中，加速大模型在金融、制造、医疗等各行业场景中的落地应用。

这次技术突破展现了国内企业在人工智能基础创新上的能力，也开创了软硬件协同发展的新模式；在全球科技竞争加剧的背景下，产业链上下游的深度协作，为构建自主可控的技术生态提供了有益探索，也为数字经济发展提供了新动力。如何将该创新模式拓展到更多领域，值得业界继续关注。