苹果推出了一款端侧ai 模型,它的参数才30亿,却干出了惊人的成绩,甚至打败了体积大24倍

苹果推出了一款叫Ferret-UI Lite的端侧AI模型,这让咱们在手机上也能用得上大模型级别的性能。它的参数才30亿,却干出了惊人的成绩,甚至打败了体积大24倍的服务器模型。这对手机用户来说真是个好消息。咱们知道,手机上的算力有限,以前那种大模型肯定是跑不起来的。Ferret-UI Lite就是个例外,它能精准理解复杂的屏幕内容。这个模型靠的是一种叫“智能裁剪”的技术,把小图标和文字给放大看清楚。这种处理方式就像咱们人眼看东西一样,先大概扫一眼,再凑近细看。这样一来,小模型也能捕捉到关键信息了。 IT之家消息提到,苹果团队在最新论文里展示了Ferret-UI Lite,这是专为手机设计的多模态大语言模型。别看它参数量只有30亿,在性能上却跟大型服务器模型打得难解难分。在多项测试中,Ferret-UI Lite不仅追平了这些大块头的表现,有些方面甚至还超过了它们。这真是个小小的巨人啊! Ferret-UI Lite的训练数据也是个亮点。研究团队为了解决数据不够用的问题,自己造了一个合成数据生成系统。系统里有“任务生成器”、“规划器”、“执行者”和“批评者”四个角色,让AI自己在模拟环境里不断试错、学习。这样生成的数据质量高,让模型学会了怎么处理点击没反应或者突然弹窗口这种意外情况。 测试结果显示,Ferret-UI Lite在做基础操作时表现得很稳当。不过在处理多步骤复杂任务时还有提升空间。最让人放心的是,它完全在本地运行,不用把屏幕截图传到云端服务器上。这给手机赋予了“自动操作App”的能力,同时也最大程度地保护了用户隐私。 总之,这个小模型给咱们上了一堂课:怎么在手机上建好GUI代理(Agents),让它们在推理时间(Inference-time)高效工作。论文题目叫“Ferret-UI Lite: Lessons from Building Small On-Device GUI Agents”。