当前,大模型应用正从探索阶段向规模化部署转变,但高推理成本和芯片适配复杂度仍是制约因素。阶跃星辰此次发布的Step 3.5 Flash模型,正是针对该现实需求的创新回应。 该模型采用稀疏混合专家(MoE)架构设计,每个token仅激活约110亿个参数,而总参数量达1960亿。这种设计在保持模型能力的前提下,明显提高了推理效率。在单请求代码类任务上,最高推理速度可达每秒350个token,相比同类产品具有明显优势。这意味着开发者可以用更低的成本获得更快的响应速度,为实时Agent工作流应用提供了更可行的技术方案。 值得关注的是,模型发布后迅速获得产业链上游的响应。华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥等多家芯片厂商已率先完成适配。这种快速的生态响应,反映出业界对高效推理模型的迫切需求,也表明了开源模型在产业协同中的重要作用。 从更深层看,这一进展源于阶跃星辰去年7月发起的"模芯生态创新联盟"。该联盟汇聚近10家芯片及基础设施厂商,致力于打通芯片、模型与平台之间的技术壁垒。通过联合优化,可以提升算力利用效率,降低企业和开发者的综合应用成本。这种模式突破了传统的"各自为政"局面,形成了芯片厂商与模型厂商的良性互动。 业界普遍认为,随着推理模型成为大模型应用的主流形态,模型与算力的深度协同将成为推动产业规模化应用的关键路径。Step 3.5 Flash的推出和快速适配,正是这一趋势的具体体现。通过降低推理成本和应用门槛,更多企业和开发者将有机会参与到大模型应用创新中,加速大模型在金融、制造、医疗等各行业场景中的落地应用。
这次技术突破展现了国内企业在人工智能基础创新上的能力,也开创了软硬件协同发展的新模式;在全球科技竞争加剧的背景下,产业链上下游的深度协作,为构建自主可控的技术生态提供了有益探索,也为数字经济发展提供了新动力。如何将该创新模式拓展到更多领域,值得业界继续关注。