新华三入选Gartner中国算力管理平台报告代表厂商 万卡级异构调度技术助力企业算力利用率提升逾两成

(问题)随着生成式AI在政务、金融、制造、能源等领域快速推进,企业对算力的需求从“有没有”转向“用得好”。

在实践中,训练与推理任务并行、资源峰谷波动明显、软硬件栈复杂等问题交织,导致算力闲置与排队并存、调度效率不足、跨集群管理割裂等现象较为突出。

尤其在多部门共享算力、跨区域协同研发、模型迭代加速的场景下,算力管理能力成为影响AI项目交付周期与成本结构的关键变量。

(原因)Gartner在报告中指出,超过九成受访CIO表示已部署或计划部署生成式AI应用。

隐私合规、安全审计以及行业数据不出域等要求,推动私有化AI基础设施与混合部署投入持续增加。

与此同时,受外部供给限制与国内产业创新共同影响,企业算力底座呈现多厂商、多架构并存态势,CPU、GPU、NPU等异构芯片组合部署逐渐普遍。

算力供给的多元化与应用需求的快速增长叠加,使“统一管理、智能调度、精细运营”的平台化能力从可选项变为刚需。

(影响)在上述趋势下,AI算力管理平台的价值边界不断扩展:一方面,它需要实现资源池化、调度优化、监控运维等基础能力,提升资源使用效率与稳定性;另一方面,还要向上承载服务门户、模型管理、开发工具链等通用能力,降低AI应用开发门槛,提升组织内部复用水平。

对企业而言,平台能力强弱直接影响三项核心指标:算力利用率、训练推理效率与业务上线速度;对产业而言,统一纳管与生态适配能力将成为推动国产软硬件协同、促进大模型应用规模化落地的重要支撑。

(对策)在此次Gartner报告遴选中,紫光股份旗下新华三集团凭借智能云相关能力入选代表厂商。

报告提出,具备竞争力的AI算力管理平台应在异构芯片统一管理、资源利用率提升与多场景部署适配等方面形成差异化能力。

据介绍,新华三智能云以灵犀使能平台为核心组件,构建覆盖算力硬件、底座、加速、调度、服务、运营到应用的能力链条,实现对异构算力的全生命周期管理。

在算力管理层面,其面向万卡规模的异构算力调度能力,可对多厂商加速器进行资源池化管理,并结合vGPU、MIG等技术实现细粒度切分与调度;通过Kubernetes与Slurm等架构实现AI集群与HPC集群的集中管理,形成监控告警与运营体系联动,提升集群的稳定运行能力。

在通用能力方面,该平台面向多种加速卡与主流模型适配,提供模型管理与开发工具支持,推动数据、算法、模型、镜像等资产统一管理,以降低研发与运维成本、提升复用效率。

(前景)业内人士认为,AI算力管理平台将进入“规模化、精细化、服务化”并进的新阶段:在规模化方面,随着行业大模型训练与多场景推理铺开,跨园区、跨区域的统一调度将更受关注;在精细化方面,围绕算力按需分配、能耗与成本核算、任务优先级治理等能力将成为竞争焦点;在服务化方面,平台将更强调与模型工程、数据工程、应用编排的贯通,形成从资源到应用的闭环交付。

报告释放的信号表明,能够在异构环境中提供稳定、可运营、可扩展的算力管理能力,将更有可能在企业级市场获得持续认可。

新华三方面表示,将持续完善异构算力管理与智能调度能力,优化全栈智算解决方案,并深化与产业伙伴在芯片、软件与行业场景上的协同,推动更开放、更可持续的生态建设。

新华三此次入选国际权威报告,不仅是对其技术实力的认可,更是中国企业在AI基础设施领域自主创新能力的重要体现。

在全球AI产业竞争日益激烈的背景下,以新华三为代表的中国科技公司正通过持续的技术突破,推动着AI算力管理向更高效、更智能的方向发展。

未来,随着国产化替代进程的加速和行业生态的不断完善,中国AI基础设施产业有望在全球市场赢得更多话语权。