问题:大模型“越大越强”与“越强越难用”的矛盾越来越明显。过去一段时间,行业普遍沿着参数规模快速扩张的路线推进,模型能力不断提升,但训练与推理成本高、部署门槛高等问题也随之累积:一方面,专用集群和算力消耗推高了应用成本;另一方面,中小企业算力、数据和工程化能力上承压明显,先进能力与真实场景之间出现“落地鸿沟”。如何在成本可控的前提下做到可用、好用、易用,成为产业共同关注的焦点。 原因:春节前后企业集中“上新”,反映出技术路线与生态策略正在同步调整。一是需求侧拉动更强。政务、制造、金融、内容生产等领域对高可靠推理、多模态理解、工具调用和流程自动化的需求快速增长,推动模型从“会答题”转向“会做事”。二是供给侧进入工程化深水区。训练走向规模化、体系化后,推理效率、显存占用和吞吐量成为决定竞争力的关键。三是开源协作加快创新扩散。通过开源,企业能在更大范围内吸引开发者与合作伙伴共同迭代,让模型在真实业务中更快验证、改进。 影响:除夕发布的千问Qwen3.5-Plus被认为是此趋势的代表。该模型在参数规模与推理开销之间重新取舍,在尽量保持能力的同时优化速度与成本,并在多项基准测试中展现竞争力;其定价也体现出降低门槛、扩大开发者覆盖面的思路。更值得关注的是,多模态能力正从“附加项”走向“原生能力”:通过文本与视觉等混合数据预训练,模型在视觉理解、推理、编程和智能体等评估中表现突出,显示出从“识别图像”向“跨模态推理与任务执行”的跃迁。 同时,春节前后多家企业的密集发布形成“集群效应”。智谱推出并开源GLM-5,强调面向智能体的工程化应用;科大讯飞发布基于国产算力训练的星火X2,突出自主可控与产业适配;MiniMax发布M2.5,强调复杂任务处理中的决策能力;字节跳动的视频生成模型Seedance2.0以多模态创作与更强的镜头语言能力受到关注。整体来看,大模型竞争正在从单点指标比拼转向“能力结构+工程效率+生态开放”的综合较量。 对策:面向下一阶段,业内普遍认为需要在三上持续投入。其一,以应用牵引技术迭代,围绕政务服务、企业经营、工业设计、科研辅助等高价值场景,强化可控推理、工具调用、流程编排与安全对齐,沉淀“能落地、可复制、可审计”的行业方案。其二,继续推进效率提升,围绕稀疏激活、推理加速、低成本部署与软硬协同优化,降低显存占用与调用成本,让更多中小主体“用得起、用得稳”。其三,做强开源生态与标准体系,推动企业、高校、科研机构与开发者社区形成协作网络,完善评测、数据治理、模型安全与合规框架,在可控范围内扩大创新扩散。 前景:从“春节档”的密集发布可以看到,中国企业正在以开源与工程化能力重塑产业节奏。中国工程院院士倪光南近期指出,开源已成为全球信息技术发展的重要动力,在大模型引领的人工智能领域尤为突出。当前,中国已成为全球开源大模型的重要供给方,有关模型在国际评测平台上保持较高关注度。展望未来,随着原生多模态与智能体能力持续成熟,模型将更深入融入内容生产、软件开发、终端交互与跨应用任务执行,推动产业从“工具使用”走向“协作伙伴”、从单点提效走向系统重构。同时,竞争也将更强调可靠性、安全性与产业适配。谁能在开放生态中持续降低门槛、提升可用性,谁就更有机会把握下一轮应用爆发。
从“春节档”的密集发布,到技术路线从规模竞赛转向效能优先,中国大模型行业正在走出一条不同于单纯参数堆叠的自主创新路径。技术的价值不在于参数多少,而在于能否真正降低使用门槛、解决现实需求。当“更聪明”逐渐取代“更庞大”成为新的衡量标准,中国科技企业能否把该轮技术红利转化为持续的产业竞争力,将是未来值得持续关注的关键。