最近,北京大学的研究者推出了一个名叫SWE-MiniSandbox的开源工具。它的目标是帮大家解决训练SWEAgent时遇到的那些难题,比如资源贵、环境难搞。以前大家总靠Docker或者Podman这种容器技术来跑代码,结果就是成本高、运维麻烦。尤其是在要跑很多任务或者想让训练快点的时候,这些容器很容易变成瓶颈。SWE-MiniSandbox的出现就是为了换一种思路,不用容器也能把事情搞定。 这个框架是怎么做的呢?它利用了Chroot、挂载命名空间这些技术,给每个任务单独弄个运行环境。这样做既不需要重镜像,又能在同样的数据和参数下,训练出跟用Docker一样好的Agent。大家要是还像以前那样每次都要重新装一遍Python环境,那效率肯定低得很。现在它用的是像conda+venv这样的轻量级Python环境,能快速搞定准备工作。再加上管好了I/O瓶颈和并发控制,任务吞吐量自然就上去了。 而且这个工具不光自己玩得转,还能跟SWE-Rex、SWE-agent还有SkyRL这些现成的工具链无缝对接。这样就能在多节点资源分配上做得更顺手,满足搞强化学习的需求。根据实验结果看,SWE-MiniSandbox占的缓存空间只有传统镜像的5%,准备环境的时间也只有Docker的25%。这就意味着用它不仅省资源,训练效果还跟原来差不多。 这个项目一出,以后肯定会有更多开发者用它来练SWEAgent,成本低效率还高。这不仅是个新机遇,也是个新挑战,给大家伙儿打开了一扇新门。