vivo总裁在博鳌论坛阐述影像技术战略 智能终端将迎感知能力升级

问题:智能能力快速发展,如何真正“看懂世界”并安全落地 随着大模型等技术迭代加快,智能能力正从“回答问题”走向“完成任务”。但真实世界中,智能系统要具备可靠的行动能力,首先要补齐“感知”和“理解”两项基础能力:如何获取高质量场景信息,如何在复杂环境中识别物体与人,如何理解空间关系与运动规律,以及如何在提升体验的同时守住隐私与安全底线。这些问题决定了智能能力能否从线上文本场景走向线下生活与产业应用。 原因:影像成为物理世界数据入口,手机具备天然场景与规模优势 胡柏山在论坛发言中指出,主动感知是智能系统有效运作的前提,而影像技术是感知能力的重要基础。相较于单一的语音或文本输入,影像能够提供更完整的场景信息,不仅能“识别是什么”,还可以更判断“在哪里、怎么动、与谁对应的”,为后续交互与决策提供支撑。 在落地载体上,胡柏山强调手机仍是智能能力最现实、也最具规模的入口。一方面,手机普及率高,贴近用户高频生活场景,具备随身与即时优势;另一方面,手机传感器体系成熟,影像、定位、加速度等多模态数据更容易形成协同,持续积累对真实世界的场景理解能力。相比不断涌现的新硬件形态,手机更有机会率先完成从“工具型设备”向“任务型助手”的转变。 影响:手机功能边界或被重塑,多终端智能生态竞争加速 从产业角度看,影像与智能能力的融合将推动手机体验从“拍得清楚”走向“看得明白”。未来影像不再只是记录与分享工具,也可能成为理解环境、辅助决策、完成任务的关键入口。胡柏山提出“智能体手机”概念,指向手机从被动响应到主动协同的演进:围绕个人日程、出行、消费、办公等需求,设备可在用户授权下进行信息组织、任务拆解与跨应用执行。 同时,该趋势将把终端生态竞争从“参数竞争”推向“能力系统竞争”。谁能在端侧计算、影像感知、交互设计与生态协同上建立持续优势,谁就更可能在新一轮智能终端变革中占据主动。对行业而言,这也意味着厂商需要在算力、算法、数据合规与产品形态上同步推进,而不是只靠单点突破。 对策:强化端侧处理与用户数据主导权,推动“影像+智能”协同演进 围绕隐私与安全,胡柏山表示用户数据应由用户自主管理,公司将重点投入端侧处理,让关键数据尽可能在本地完成计算,减少对云端的依赖,从机制上降低潜在泄露风险。这一表态回应了公众对数据合规、敏感信息保护,以及智能功能“越用越懂你”所带来边界问题的现实关注。 在技术路径上,他强调影像与智能不是替代关系,而应协同发展:影像提供可信的场景信息输入,智能能力在此基础上完成理解与任务执行,从而形成更稳定的闭环体验。以生活场景为例,通过持续积累真实场景数据,并在端侧迭代部分理解能力,终端可在购物、会议等场景提供更及时的辅助服务,例如在特定地点呈现个性化信息、在办公场景中自动整理要点等。但要真正可用,仍需在授权机制、可解释性与误触发控制等建立更清晰的产品规范。 前景:影像能力或向机器人、MR等外延扩展,多终端协同成为关键变量 胡柏山还透露,未来将把影像技术优势延伸至MR头显、家用机器人等产品形态。业内普遍认为,随着终端形态多元化,单一设备难以覆盖全部场景,多终端协同将成为体验提升的重要方向。MR与机器人对空间理解、定位避障、手眼协同等能力要求更高,也对影像感知与端侧推理提出更严苛的实时性和可靠性标准。若影像能力与端侧智能体系能够在多终端复用,并通过统一的隐私与权限体系进行管理,有望在家庭与办公场景形成更连续的服务链条。 可以预见,终端智能化下一阶段的竞争,不仅在于“是否接入智能能力”,更在于能否在真实世界形成稳定的感知、决策与执行闭环,并在安全合规前提下实现规模化落地。影像作为物理世界数据入口的重要性将持续上升,而端侧处理能力的提升也将决定体验上限与信任基础。

从“拍得更清晰”到“看得更明白”,影像技术的角色正在改变;从“云端更强”到“本地更稳”,数据安全的边界也在重新划定。博鳌论坛释放的信号表明,智能终端的下一轮竞争,将更多取决于对真实世界的理解能力、对用户权益的尊重,以及对生态协同的组织能力。谁能在技术进步与治理规范之间建立可信平衡,谁就更可能在新周期中赢得主动。