字节跳动搞了个大新闻,把他们的豆包大模型正式升级到了2.0版本。这次更新,他们一口气给我们带来了Pro、Lite、Mini这三款通用的Agent模型,还有专门用来写代码的Code模型。这些模型把多模态的能力给大幅度升级了,不管是看图片还是看长视频,豆包都能搞懂里面的门道,甚至在一些关键测试中都拿了第一名。而且最厉害的是,这次做推理的成本竟然比以前降低了差不多十倍,这对开发来说简直太友好了。 IT之家也发消息说,豆包2.0专门围绕咱们平时用的那些复杂场景做了优化。这个版本里面有Pro、Lite、Mini还有Code四款主力产品,大家可以根据自己的需求来选。比如说Pro版本专门对付那些需要深度推理和长时间干活的任务,它的能力直接对标了GPT 5.2和Gemini 3 Pro;Lite版本是想在性能和成本之间找个平衡,虽然是轻量级的,但综合能力比老一代的豆包1.8还强;Mini版本就适合那些对速度和价格特别敏感的地方;Code版本则是专为写程序准备的,跟TRA E结合起来用效果更好。 现在Pro版本已经在咱们平时用的App、电脑端还有网页版上线了,大家只要选个“专家”模式就能跟它对话聊天了。Code版本也接入了TRA E这个编程工具。另外给开发者和企业用的火山引擎API服务也已经开通了。 豆包2.0在理解图片和视频这方面是真的强。不管是看图推理、感知物体还是处理复杂的空间关系,它都干得漂亮。Pro版本在很多基准测试里都拿到了最高分。特别是在那种动态变化的场景里,豆包2.0对时间和运动的感觉特别敏锐,在TVBench这些关键评测中都冲到了前面。还有在EgoTempo这个测试里,它甚至比人类表现还好,说明它能更稳定地捕捉“变化、动作、节奏”这些信息。 在看长视频这块儿,豆包2.0也把其他模型甩开了一大截。不光能做问答,它还能主动给你纠正错误、陪你聊天,就像个贴心的小助手一样。你想在健身或者穿搭的时候有个伴儿?它就能帮你搞定。 要想在真正复杂的任务里把活儿干好,得懂很多真实世界的知识才行。豆包2.0 Pro这次加强了对那些不太热门领域的了解。它在SuperGPQA上的分数已经超过了GPT 5.2;在HealthBench上更是拿了第一名;在科学方面的成绩跟Gemini 3 Pro和GPT 5.2也不相上下。 在数学推理和解题这块儿,豆包2.0 Pro也是一把好手。它在IMO(国际数学奥赛)、CMO(中国数学奥赛)还有ICPC编程竞赛里都拿了金牌成绩;在Putnam Bench这个测试里也超过了Gemini 3 Pro;最后在那个号称“人类的最后考试”的HLE-text上拿到了54.2分的最高分。 虽然效果这么好,但豆包2.0的价格却很亲民。它的模型效果跟业界顶尖的那些大模型差不多强,但每个token的价格却便宜了十倍左右。要是平时写程序或者做复杂的任务经常要算很多次成本的话,这一优势就显得特别关键。 针对写代码这块儿专门优化的Doubao-Seed-2.0-Code模型也特别厉害。它不光能看懂代码库是怎么回事儿了,还能帮你把应用快速搭起来。特别是在Agent的工作流程中纠错能力也有提升。这个模型已经上了TRA E中国版作为内置工具了。 举个实际的例子吧。假如要开发一个叫“TRA E春节小镇·马年庙会”的互动项目。这本来是个挺复杂的活儿吧?但有了TRA E加上Doubao-Seed-2.0-Code的帮忙,只需要输入一轮提示词就能把基础架构搭出来;然后稍微调试个几次提示词总共也就是五轮功夫就搞定了! 官方的说法是说这次更新是咱们面对现实世界复杂任务的新起点。未来他们还会继续盯着真实的场景去改进模型,把智能上限再往上抬一抬。