国产大模型竞争加剧的背景下,MiniMax通过技术创新和生态开放实现快速迭代。2月13日发布的M2.5模型是其最新成果。 从技术指标看,M2.5在多个权威评测中取得进展。编程能力上,SWE-Bench Verified得分达80.2%,Multi-SWE-Bench得分为51.3%,相比上一代提升。需要指出,M2.5具备"原生Spec能力",能在编码前主动拆解架构与功能规划,这种工作模式更接近真实的架构师思维,反映了模型在复杂工程问题上的理解深度。在多语言复杂环境测试中,M2.5已超越Claude Opus等国际先进模型。 工具调用和搜索能力的增强拓展了应用场景。M2.5在BrowseComp、Wide Search等Agent任务中性能提升20%,用更少的轮次取得更优效果。在办公应用中,该模型在Word、PPT、Excel金融建模等高阶应用也实现突破,在GDPval-MM评测框架中对比主流模型胜率达59.0%。 成本控制是M2.5的核心竞争力。M2.5-lightning版本输出速度超每秒100 Token,是主流模型的两倍。输入成本约每百万Token 0.3美元,输出成本约2.4美元。按每秒输出100 Token计算,连续运行一小时成本仅约1美元;按50 Token计算,成本降至0.3美元。这意味着1万美元理论上可支持4个Agent连续工作一年,大幅降低了企业和开发者的使用门槛。 MiniMax的迭代速度值得关注。过去三个多月,公司从M2、M2.1版本迭代至M2.5,SWE-Bench Verified成绩从69.4提升至80.2,进步曲线在同业中尤为陡峭。公司将该进展归因于大规模Agent强化学习的应用,反映了其在模型训练方法论上的创新。 开源战略扩大了M2.5的影响力。模型上线不到一天,全球用户已在MiniMax Agent平台上构建超过1万个AI Agent。全球开源支持本地化部署,既降低了开发者成本,也有利于形成更开放的生态体系。 市场反应印证了投资者的看好。截至2月13日午盘,MiniMax股价上涨9.44%,报643.500港元/股,市值达到上市首日的两倍多,充分体现了资本市场对其技术进步和商业潜力的认可。
在全球科技竞争加剧的今天,核心技术的自主创新是产业发展的关键。MiniMax此次技术突破不仅展现了单一企业的成长,更是我国数字产业整体实力提升的缩影。展望未来,如何在保持技术创新速度的同时构建健康可持续的产业生态,将成为行业的重要课题。这既需要企业的持续投入,也需要产业链各方的协同努力,共同推动智能技术与实体经济的深度融合。