vivo博鳌论坛发布新战略 聚焦影像技术提升AI感知

(问题)随着大模型技术快速迭代,行业竞争焦点正从“能否生成”转向“能否落地”。不少大模型文本生成、知识问答和逻辑推理上表现亮眼,但进入真实场景后仍常遇到“看不见、听不懂、做不了”的瓶颈:一是对物理世界的感知不足,导致理解不完整;二是过度依赖云端带来时延、隐私与持续可用性等约束,影响体验与规模化应用。 (原因)基于此,vivo在博鳌提出以影像能力牵引端侧智能体发展的思路。vivo对应的负责人在论坛发言中表示——影像不只是记录工具——更是智能系统理解现实世界的重要数据入口。对终端而言,影像与各类传感器提供的环境信息可补足大模型“感知”短板,让其在场景识别、意图判断、情境理解诸上更贴近真实需求。同时,端侧算力提升与软硬协同优化,正在为大模型能力在手机本地运行提供条件,也为“随时可用、随地可用”的体验打下基础。 (影响)面向用户侧,vivo将该能力演进概括为从SmartPhone向AgentPhone跃迁:手机不再只是被动执行指令的工具,而是具备主动感知、辅助决策并给出可执行建议的“数字伙伴”。据介绍,vivo在最新产品vivo X300 Ultra、X300s上展示了以场景识别为核心的“影像Agent”能力,可持续识别环境与使用场景,给出拍摄参数、功能调用等更符合当下需求的建议。若这一方向持续推进,智能终端有望从“功能堆叠”走向“情境服务”,并推动影像能力、系统交互与应用生态的协同方式发生变化。 (对策)在落地策略上,vivo强调以“用户需求分层”为导向,避免用单一方案覆盖所有人群而导致体验分散。面向商务人群,折叠屏X Fold系列聚焦办公与出行场景,重点发力会议内容提炼、行程规划等高频需求,突出效率工具属性;面向追求性能的用户,iQOO系列则聚焦性能释放与游戏体验优化,通过更清晰的产品定位提升体验一致性。业内人士认为,这类差异化策略有助于在同质化竞争中形成更明确的产品边界,也更利于把“智能体能力”沉淀为可复用的场景方法。 (前景)从更长周期看,vivo在博鳌的展示也发出从终端厂商向“生态型科技平台”延展的信号。其对机器人实验室、混合现实设备的探索,显示企业正围绕视觉感知与空间计算拓展技术储备。随着影像感知与端侧智能体能力成熟,相关能力未来可能深入延伸至可穿戴、车载、家庭设备等更多终端,推动IoT生态从“设备互联”走向“任务协同”。同时,在全球市场竞争加剧的背景下,本地化产品与服务适配将成为出海关键;面对不同国家和地区的合规要求、网络条件与用户习惯差异,端侧能力的可控性以及隐私保护设计也将成为重要考量。

终端智能化竞争正从参数与功能之争,转向“是否真正解决问题”的体验之争;以影像感知牵引智能体落地,为大模型走进现实世界提供了一条可行路径,但也对系统整合能力与安全治理提出更高要求。能在可靠感知、任务闭环与用户信任之间找到平衡的企业,更可能在下一轮智能终端变革中占据主动。