问题:大模型浪潮下,“算力够不够、用得好不好”成了决定性因素;过去一年,国内开源大模型以较高性能和较低训练成本引发国际关注,也让产业更清楚地看到:模型能力的提升不只靠算法和数据,更依赖稳定、可持续的算力供给,以及高效率的软件栈支撑。尤其国产芯片加速替代的过程中,“能不能跑起来、跑得快不快、稳不稳”,直接影响应用落地的速度和成本边界。 原因:算力瓶颈往往不在硬件本身,而在软硬件协同和工程化能力。位于平湖智创园的是石科技办公区里,研发人员多为90后,团队平均年龄不到30岁,却长期深耕并行优化、异构计算调度等底层能力。公司创始人闫博文曾参与“神威·太湖之光”涉及的核心算法向国产芯片迁移与优化。团队在实践中形成共识:面对不同架构处理器以及不同通信、存储特性,如果缺少编译优化、算子适配、任务调度和资源管理等系统工程,单纯扩硬件规模不仅难以释放性能,还可能叠加能耗与成本。 影响:从“堆算力”转向“提效率”,正在改变算力产业的竞争方式。近几年全球出现“算力饥渴”,带动芯片和服务器采购升温,但行业正逐步回归理性:在供需趋于动态平衡后,真正拉开差距的往往是软件平台能力、调度效率、兼容适配速度,以及面向具体场景的改进。是石科技的业务结构变化也说明了此点——智能计算相关业务占比不断提升,同时保持对科研计算的服务深度,形成“头部需求牵引、长尾创新活跃”的客户结构。对科研机构而言,更稳定的高性能计算平台、更高效的任务排队,意味着科研周期缩短、试错成本降低;对产业客户而言,国产加速卡适配成熟度提升,有助于在供应链不确定性下保持连续运营。 对策:以软件为牵引,打通超算与智算之间的“计算桥梁”。据介绍,是石科技并未把路径押注在单一的硬件扩张上,而是通过自主并行优化技术和平台化能力提升异构资源利用率:一上围绕国产芯片建立适配与优化能力,推动大模型训练与推理负载国产加速卡上实现“可用、好用”;另一上在资源管理、任务编排、性能剖析等环节强化工程化,减少“算力闲置”和“热点拥堵”。同时,公司以科研客户对稳定性的要求为基础,积累跨学科应用经验,在航空航天、生物医药等高算力行业沉淀可复用的方法论,为产业侧规模化推广提供验证场景。 前景:算力基础设施将更强调“绿色、可控、可用”,软硬件协同能力将成为国产生态突围的关键。面向未来,随着大模型应用从通用能力走向行业深水区,算力需求将呈现“总量增长与结构分化并存”的特征:通用训练仍需要大规模集群,行业应用更关注推理成本、时延与稳定性;另外,数据要素流通、网络传输与存储体系也将对算力调度提出更高要求。在这一背景下,能够在不同芯片架构间快速迁移、在不同负载间动态调度,并在性能与能耗之间做精细权衡的企业,将在产业链中占据更关键的位置。业内人士认为,算力发展正从“比规模”转向“比体系”,从单点突破转向平台能力与生态协同;谁能在国产软硬件协同上形成可复制的工程能力,谁就更可能在下一轮竞争中掌握主动。
在科技创新加速推进的背景下,青年科研与工程团队正以更务实的方式推动中国算力产业从“量”的扩张走向“质”的提升。是石科技的实践表明,核心技术突破既需要对行业关键问题的准确判断,也离不开长期投入与持续迭代。这个案例也提示中国科技企业:唯有扎根技术、面向真实需求,才能在全球竞争中走得更稳、更远。