智谱公司因服务能力不足致歉用户推出延期补偿与退款双轨方案

问题—— 近期，部分开发者使用 GLM Coding Plan 有关服务时反馈，出现调用受限、响应变慢等情况，打乱了日常开发和测试节奏；对此，智谱在开发者社群公开致歉，表示新版本上线后供需匹配出现阶段性偏差，并说明了服务开放节奏及补偿安排。原因—— 从企业披露的信息来看，这次波动主要源于访问量增长过快，而算力扩张未能同步跟上。GLM-5 发布后，新增用户和调用频次明显上升，压力在高峰时段集中释放。在大模型与编程辅助产品普遍采用“云端推理 + 按需计费/订阅”的模式下，算力弹性调度、容量冗余和峰值预案直接决定服务稳定性。一旦增长超出预估，扩容、调度与限流策略没有提前协同到位，就容易出现“能用但不稳”的体验落差。影响—— 对开发者来说，编程辅助工具的价值很大程度取决于稳定与连续：高峰限流会直接影响代码生成、调试和联调效率，进而拖慢交付节奏、打乱团队协作安排。对企业而言，这类事件既是运维压力测试，也是对产品口碑与商业信誉的考验——尤其在面向开发者的订阅计划中，沟通是否透明、补偿是否明确，直接关系到信任能否维持。有一点是，市场对公司成长性与业务热度仍保持关注。据公开市场信息，2 月 20 日港股节后首个交易日，该公司股价盘中走强，收盘报 725 港元，较节前收盘价 508 港元上涨 42.7%。股价表现与短期服务波动不一定同向，但也侧面反映投资者对其技术路线与商业化进展的预期仍较高。，如何把“热度”转化为“口碑”，更考验企业的运营与交付能力。对策—— 针对当前问题，智谱给出两项并行措施：分层开放与错峰灰度，以及补偿与退款可选。在服务开放安排上，公司表示将 GLM-5 按 Max、Pro、Lite 三个层级逐步放开：Max 用户已全面开放；Pro 用户虽已开放，但高峰时段可能因集群负载较高而出现限流；Lite 用户将于节后在非高峰时段逐步灰度开放。分级策略有助于在算力紧张时优先保障高等级用户的稳定体验，同时通过灰度方式验证扩容与调度效果，降低全量开放的风险。在用户权益上，公司明确：受影响的 Lite 与 Pro 用户可自主申请退款；如不选择退款，则包括 Max 在内的所有用户统一顺延 15 天权益。相较单一补偿方式，“退款 + 顺延”的组合更便于用户按自身使用强度和项目周期做选择，也有助于减少因体验波动带来的争议。前景—— 从行业趋势看，编程辅助、智能体与开发者工具正成为大模型落地的重要方向，用户对“能用”的要求正快速升级为对“稳定、确定、成本可预期”的要求。接下来，竞争重点也将从参数规模与功能迭代，延伸到容量规划、峰值保障、SLA 承诺、计费透明，以及多层次服务体系建设。对智谱而言，后续关键在三点：其一，加快扩容并优化调度体系，提升峰值承载与故障恢复能力；其二，把分级服务的边界、限制与提示机制讲清楚，让用户在购买与使用阶段形成稳定预期；其三，持续加强与开发者社群的沟通，以更透明的信息披露、更快的响应和可执行的补偿方案，尽快修复体验信心。若这些措施落地到位，短期波动有望转化为一次系统升级与治理能力提升的契机。

此次服务波动既检验了企业的应急与交付能力，也折射出 AI 基础设施建设的紧迫性。如何在技术迭代与用户体验之间找到平衡，将成为影响行业格局的重要因素。正如业内人士所言：“算力时代的竞争不仅是算法优劣的比拼，更是服务体系成熟度的较量。”

智谱公司因服务能力不足致歉用户 推出延期补偿与退款双轨方案

智谱公司因服务能力不足致歉用户推出延期补偿与退款双轨方案