vivo博鳌论坛发布新战略聚焦影像技术提升AI感知

（问题）随着大模型技术快速迭代，行业竞争焦点正从“能否生成”转向“能否落地”。不少大模型文本生成、知识问答和逻辑推理上表现亮眼，但进入真实场景后仍常遇到“看不见、听不懂、做不了”的瓶颈：一是对物理世界的感知不足，导致理解不完整；二是过度依赖云端带来时延、隐私与持续可用性等约束，影响体验与规模化应用。（原因）基于此，vivo在博鳌提出以影像能力牵引端侧智能体发展的思路。vivo对应的负责人在论坛发言中表示——影像不只是记录工具——更是智能系统理解现实世界的重要数据入口。对终端而言，影像与各类传感器提供的环境信息可补足大模型“感知”短板，让其在场景识别、意图判断、情境理解诸上更贴近真实需求。同时，端侧算力提升与软硬协同优化，正在为大模型能力在手机本地运行提供条件，也为“随时可用、随地可用”的体验打下基础。（影响）面向用户侧，vivo将该能力演进概括为从SmartPhone向AgentPhone跃迁：手机不再只是被动执行指令的工具，而是具备主动感知、辅助决策并给出可执行建议的“数字伙伴”。据介绍，vivo在最新产品vivo X300 Ultra、X300s上展示了以场景识别为核心的“影像Agent”能力，可持续识别环境与使用场景，给出拍摄参数、功能调用等更符合当下需求的建议。若这一方向持续推进，智能终端有望从“功能堆叠”走向“情境服务”，并推动影像能力、系统交互与应用生态的协同方式发生变化。（对策）在落地策略上，vivo强调以“用户需求分层”为导向，避免用单一方案覆盖所有人群而导致体验分散。面向商务人群，折叠屏X Fold系列聚焦办公与出行场景，重点发力会议内容提炼、行程规划等高频需求，突出效率工具属性；面向追求性能的用户，iQOO系列则聚焦性能释放与游戏体验优化，通过更清晰的产品定位提升体验一致性。业内人士认为，这类差异化策略有助于在同质化竞争中形成更明确的产品边界，也更利于把“智能体能力”沉淀为可复用的场景方法。（前景）从更长周期看，vivo在博鳌的展示也发出从终端厂商向“生态型科技平台”延展的信号。其对机器人实验室、混合现实设备的探索，显示企业正围绕视觉感知与空间计算拓展技术储备。随着影像感知与端侧智能体能力成熟，相关能力未来可能深入延伸至可穿戴、车载、家庭设备等更多终端，推动IoT生态从“设备互联”走向“任务协同”。同时，在全球市场竞争加剧的背景下，本地化产品与服务适配将成为出海关键；面对不同国家和地区的合规要求、网络条件与用户习惯差异，端侧能力的可控性以及隐私保护设计也将成为重要考量。

终端智能化竞争正从参数与功能之争，转向“是否真正解决问题”的体验之争；以影像感知牵引智能体落地，为大模型走进现实世界提供了一条可行路径，但也对系统整合能力与安全治理提出更高要求。能在可靠感知、任务闭环与用户信任之间找到平衡的企业，更可能在下一轮智能终端变革中占据主动。

vivo博鳌论坛发布新战略 聚焦影像技术提升AI感知

vivo博鳌论坛发布新战略聚焦影像技术提升AI感知