国内科技公司推出新一代多模态大模型 技术突破推动全球开源发展

(问题)当前,大模型正从“能用”迈向“好用、易用、低成本且可规模化”,这已成为行业共同课题。一方面,企业与开发者对长上下文处理、复杂推理、编程以及多步骤任务的需求快速上升;另一方面,训练与部署成本、算力消耗以及应用落地难度,仍是规模化推广的主要瓶颈。,如何不过度增加算力负担的前提下提升综合能力,并把能力沉淀为可用的工具链与应用,成为各家竞争焦点。 (原因)阿里巴巴此次开源发布千问Qwen3.5-Plus,核心聚焦“效率”和“多模态”。据介绍,新模型对底层架构做了系统升级:总参数规模达3970亿,但推理时激活参数约170亿,通过混合专家等机制,在较低激活规模下获得更强综合表现。同时,模型从以文本为主的训练方式转向原生多模态训练,在预训练阶段引入视觉与文本混合数据,并补充多语言、理工科与推理类数据,以提升对现实世界信息的理解与推断能力。此路线变化也反映出行业竞争从单项能力比拼,转向“架构效率+数据体系+工程化能力”的综合较量。 (影响)从产业层面看,效率提升直接影响落地成本与应用规模。该模型在显存占用、推理吞吐各上的优化,有助于降低企业部署门槛,同等算力下提升服务能力,也让中小开发者更易上手。价格策略同样释放信号:接口调用成本下探,有望带动更多试用与二次开发,加快工具链、插件和行业应用的扩散。,多模态能力增强,使模型在图文理解、文档识别、视频理解、空间定位等任务上拥有更大应用空间,可为智能终端、办公协同、内容生产与工业场景提供新的能力底座。围绕“智能体”的探索也在推进,新模型用于支持跨终端、多步骤操作等任务,显示大模型正从问答与生成,走向可执行的流程编排与自动化。 (对策)面向下一阶段竞争,行业仍需在三上持续投入:其一,推进开源生态与工具链建设,形成可复用的模型、数据处理、评测与安全治理组件,降低开发与迁移成本;其二,强化面向真实场景的工程化优化,包括长上下文推理、吞吐与时延控制、端侧与云端协同部署等,提高可用性与稳定性;其三,完善合规与安全体系,围绕数据来源、内容安全、隐私保护与风险评估建立更可操作的规范与审计机制,让技术演进与治理能力同步提升。 (前景)近期,多家企业密集发布新模型与新版本,表明产业进入迭代加速期。未来一段时间,竞争焦点可能从单项评测排名,延伸到三条主线:一是“多模态+推理”逐步成为通用能力标配;二是“低成本高效率”决定商业化速度与覆盖面;三是“智能体化”推动从模型能力走向任务交付。随着算力基础设施演进、训练与推理工程改进以及开源生态扩张,大模型有望更深入融入办公、生产与公共服务等场景。同时,也需要以更高标准推进安全、可信与可控,确保技术红利持续释放。

千问3.5的发布显示国产大模型在技术与应用落地上继续提速。从架构升级到推理效率提升,从成本下探到多模态能力强化,该模型在多个关键维度实现进展。随着国产大模型持续迭代、应用场景不断拓展,AI的普及与产业化进程有望加快,为经济社会发展带来新的增长动能。