我国的全模态大模型技术迎来了一个新的里程碑,百度推出了文心5.0正式版。这个模型实现了原生多模态统一建模,把文本、图像、音频和视频等多种数据结合在了一起。它不像行业普遍用的“后期融合”方法,而是通过统一的架构把不同模态的数据整合在一起进行训练,让模型更好地理解各种信息之间的关系。文心5.0这次参数规模达到了2.4万亿,并且采用了混合专家结构来优化激活参数比例,把比例控制在3%以下,既能保持强大能力,又能提高推理效率。在国际基准测试中,文心5.0的表现非常出色,超过了很多主流模型,比如Gemini-2.5-Pro和GPT-5-High。这个模型在图像和视频生成能力上达到了专业水平。根据最新的LMArena全球排名,文心5.0以1460分位列国内文本榜单首位和全球第八位。 值得注意的是,文心5.0在处理复杂任务上也有亮点。在技术演示中,它能通过一段视频教程自动解析步骤和逻辑,生成前端代码。在创意写作方面,它也能模仿古典文学风格来写商业方案。百度副总裁吴甜表示,这个突破得益于持续创新和工程实践。模型通过端到端强化学习训练提升了智能体和工具调用能力,同时还构建了大规模工具环境和合成长程任务数据来支撑复杂问题解决能力。 为了提高模型质量,“文心导师”计划已经有835位专家加入进来,他们来自科技、金融、文化、教育、医疗等多个行业以及数学、物理、化学等学科领域,给模型提供指导和校准。 这次发布也具有重要意义。一方面它标志着原生全模态技术从理论走向应用;另一方面它也体现了我国在底层架构方面的自主创新能力。文心5.0为产业智能化转型提供了技术基础。未来随着人工智能和实体经济融合不断深入,我们会看到更多创新成果出现。 个人用户可以通过文心APP或官网体验功能,企业和开发者可以使用百度千帆平台进行调用。分层服务体系有助于推动AI在更多场景中落地应用。