问题—— 近期,部分开发者使用 GLM Coding Plan 有关服务时反馈,出现调用受限、响应变慢等情况,打乱了日常开发和测试节奏;对此,智谱在开发者社群公开致歉,表示新版本上线后供需匹配出现阶段性偏差,并说明了服务开放节奏及补偿安排。 原因—— 从企业披露的信息来看,这次波动主要源于访问量增长过快,而算力扩张未能同步跟上。GLM-5 发布后,新增用户和调用频次明显上升,压力在高峰时段集中释放。在大模型与编程辅助产品普遍采用“云端推理 + 按需计费/订阅”的模式下,算力弹性调度、容量冗余和峰值预案直接决定服务稳定性。一旦增长超出预估,扩容、调度与限流策略没有提前协同到位,就容易出现“能用但不稳”的体验落差。 影响—— 对开发者来说,编程辅助工具的价值很大程度取决于稳定与连续:高峰限流会直接影响代码生成、调试和联调效率,进而拖慢交付节奏、打乱团队协作安排。对企业而言,这类事件既是运维压力测试,也是对产品口碑与商业信誉的考验——尤其在面向开发者的订阅计划中,沟通是否透明、补偿是否明确,直接关系到信任能否维持。 有一点是,市场对公司成长性与业务热度仍保持关注。据公开市场信息,2 月 20 日港股节后首个交易日,该公司股价盘中走强,收盘报 725 港元,较节前收盘价 508 港元上涨 42.7%。股价表现与短期服务波动不一定同向,但也侧面反映投资者对其技术路线与商业化进展的预期仍较高。,如何把“热度”转化为“口碑”,更考验企业的运营与交付能力。 对策—— 针对当前问题,智谱给出两项并行措施:分层开放与错峰灰度,以及补偿与退款可选。 在服务开放安排上,公司表示将 GLM-5 按 Max、Pro、Lite 三个层级逐步放开:Max 用户已全面开放;Pro 用户虽已开放,但高峰时段可能因集群负载较高而出现限流;Lite 用户将于节后在非高峰时段逐步灰度开放。分级策略有助于在算力紧张时优先保障高等级用户的稳定体验,同时通过灰度方式验证扩容与调度效果,降低全量开放的风险。 在用户权益上,公司明确:受影响的 Lite 与 Pro 用户可自主申请退款;如不选择退款,则包括 Max 在内的所有用户统一顺延 15 天权益。相较单一补偿方式,“退款 + 顺延”的组合更便于用户按自身使用强度和项目周期做选择,也有助于减少因体验波动带来的争议。 前景—— 从行业趋势看,编程辅助、智能体与开发者工具正成为大模型落地的重要方向,用户对“能用”的要求正快速升级为对“稳定、确定、成本可预期”的要求。接下来,竞争重点也将从参数规模与功能迭代,延伸到容量规划、峰值保障、SLA 承诺、计费透明,以及多层次服务体系建设。 对智谱而言,后续关键在三点:其一,加快扩容并优化调度体系,提升峰值承载与故障恢复能力;其二,把分级服务的边界、限制与提示机制讲清楚,让用户在购买与使用阶段形成稳定预期;其三,持续加强与开发者社群的沟通,以更透明的信息披露、更快的响应和可执行的补偿方案,尽快修复体验信心。若这些措施落地到位,短期波动有望转化为一次系统升级与治理能力提升的契机。
此次服务波动既检验了企业的应急与交付能力,也折射出 AI 基础设施建设的紧迫性。如何在技术迭代与用户体验之间找到平衡,将成为影响行业格局的重要因素。正如业内人士所言:“算力时代的竞争不仅是算法优劣的比拼,更是服务体系成熟度的较量。”