谷歌推进Gemini屏幕自动化功能 AI助手将可代理用户操控安卓设备

谷歌近日安卓系统测试版中加入一项屏幕自动化功能,预示智能手机的交互方式可能出现新的变化。据专业技术媒体披露,该功能开发代号为“倭黑猩猩”,核心在于借助系统级权限,把不同应用中的操作智能串联起来。技术原理显示,这项功能基于 Android 16 QPR3 的系统架构,可识别界面元素并模拟用户点击、滑动等操作。与传统语音助手主要依赖指令执行不同,它能够直接在第三方应用内完成更复杂的流程,例如提交订单、预约服务等。开发文档还提到,系统会实时捕捉屏幕内容并进行分析后再做决策,从而提升任务执行的准确性。需要注意的是,谷歌在测试说明中多次强调其局限性。官方提醒自动化操作可能出现误判,建议用户全程监督。隐私条款同样引发关注:功能启用后,系统截图可能会被审核人员查看,用于优化服务,这种数据处理方式也引起业界对个人信息保护的讨论。市场分析认为,该技术的落地面临三上挑战:一是系统权限如何界定,授权过宽可能影响应用生态;二是责任归属更复杂,自动化操作引发纠纷时如何划分责任仍待明确;三是用户信任的建立需要更透明的数据处理与合规机制。为应对有关风险,谷歌在测试阶段设置了多重安全边界,包括限制处理敏感金融操作、提供即时中断功能,并在条款中明确免责范围。同期曝光的“芥末”虚拟形象集成项目也显示,谷歌正尝试构建更完整的智能交互体系。前瞻产业研究院数据显示,全球智能辅助市场规模预计将在 2025 年突破千亿美元。在此背景下,安卓系统的此次试水具有一定风向标意义。不过也有专家建议,相关功能在正式商用前,应当遵循“技术成熟度与监管完备性同步”原则。

技术进步的意义在于提升效率与体验,但越接近“替人做决定、替人完成交易”,越需要把规则与责任提前明确。屏幕自动化带来的不仅是便利,也是在隐私保护、风险控制和平台治理上的一次综合检验。只有在安全可控、权责清晰的前提下,这种新的交互方式才能从测试走向日常,成为真正可靠的工具。