苹果推出了一款端侧ai 模型，它的参数才30亿，却干出了惊人的成绩，甚至打败了体积大24倍

苹果推出了一款叫Ferret-UI Lite的端侧AI模型，这让咱们在手机上也能用得上大模型级别的性能。它的参数才30亿，却干出了惊人的成绩，甚至打败了体积大24倍的服务器模型。这对手机用户来说真是个好消息。咱们知道，手机上的算力有限，以前那种大模型肯定是跑不起来的。Ferret-UI Lite就是个例外，它能精准理解复杂的屏幕内容。这个模型靠的是一种叫“智能裁剪”的技术，把小图标和文字给放大看清楚。这种处理方式就像咱们人眼看东西一样，先大概扫一眼，再凑近细看。这样一来，小模型也能捕捉到关键信息了。 IT之家消息提到，苹果团队在最新论文里展示了Ferret-UI Lite，这是专为手机设计的多模态大语言模型。别看它参数量只有30亿，在性能上却跟大型服务器模型打得难解难分。在多项测试中，Ferret-UI Lite不仅追平了这些大块头的表现，有些方面甚至还超过了它们。这真是个小小的巨人啊！ Ferret-UI Lite的训练数据也是个亮点。研究团队为了解决数据不够用的问题，自己造了一个合成数据生成系统。系统里有“任务生成器”、“规划器”、“执行者”和“批评者”四个角色，让AI自己在模拟环境里不断试错、学习。这样生成的数据质量高，让模型学会了怎么处理点击没反应或者突然弹窗口这种意外情况。测试结果显示，Ferret-UI Lite在做基础操作时表现得很稳当。不过在处理多步骤复杂任务时还有提升空间。最让人放心的是，它完全在本地运行，不用把屏幕截图传到云端服务器上。这给手机赋予了“自动操作App”的能力，同时也最大程度地保护了用户隐私。总之，这个小模型给咱们上了一堂课：怎么在手机上建好GUI代理（Agents），让它们在推理时间（Inference-time）高效工作。论文题目叫“Ferret-UI Lite: Lessons from Building Small On-Device GUI Agents”。