谷歌推进Gemini屏幕自动化功能 AI助手将可代理用户操控安卓设备

谷歌近日安卓系统测试版中加入一项屏幕自动化功能，预示智能手机的交互方式可能出现新的变化。据专业技术媒体披露，该功能开发代号为“倭黑猩猩”，核心在于借助系统级权限，把不同应用中的操作智能串联起来。技术原理显示，这项功能基于 Android 16 QPR3 的系统架构，可识别界面元素并模拟用户点击、滑动等操作。与传统语音助手主要依赖指令执行不同，它能够直接在第三方应用内完成更复杂的流程，例如提交订单、预约服务等。开发文档还提到，系统会实时捕捉屏幕内容并进行分析后再做决策，从而提升任务执行的准确性。需要注意的是，谷歌在测试说明中多次强调其局限性。官方提醒自动化操作可能出现误判，建议用户全程监督。隐私条款同样引发关注：功能启用后，系统截图可能会被审核人员查看，用于优化服务，这种数据处理方式也引起业界对个人信息保护的讨论。市场分析认为，该技术的落地面临三上挑战：一是系统权限如何界定，授权过宽可能影响应用生态；二是责任归属更复杂，自动化操作引发纠纷时如何划分责任仍待明确；三是用户信任的建立需要更透明的数据处理与合规机制。为应对有关风险，谷歌在测试阶段设置了多重安全边界，包括限制处理敏感金融操作、提供即时中断功能，并在条款中明确免责范围。同期曝光的“芥末”虚拟形象集成项目也显示，谷歌正尝试构建更完整的智能交互体系。前瞻产业研究院数据显示，全球智能辅助市场规模预计将在 2025 年突破千亿美元。在此背景下，安卓系统的此次试水具有一定风向标意义。不过也有专家建议，相关功能在正式商用前，应当遵循“技术成熟度与监管完备性同步”原则。

技术进步的意义在于提升效率与体验，但越接近“替人做决定、替人完成交易”，越需要把规则与责任提前明确。屏幕自动化带来的不仅是便利，也是在隐私保护、风险控制和平台治理上的一次综合检验。只有在安全可控、权责清晰的前提下，这种新的交互方式才能从测试走向日常，成为真正可靠的工具。