我国自主研发大模型技术取得重大突破 GLM-5开源系统性能达国际领先水平

当前,大模型技术已成为推动人工智能发展的核心驱动力。开源模型领域,如何突破性能瓶颈、提升实际应用能力,成为业界关注的焦点。智谱AI近日发布的GLM-5大模型,在这个方向上做出了有益探索。 GLM-5在规模和数据上实现了明显提高。该模型参数扩展至744亿,其中激活参数为40亿,相比前代产品有了质的飞跃。预训练数据量从23万亿提升至28.5万亿,数据规模的增加为模型性能提升奠定了基础。这种参数和数据的双重扩展,反映了开源模型在追求性能极限上的持续努力。 技术创新是GLM-5的核心竞争力。该模型引入了全新的"Slime"框架和异步强化学习算法,同时采用稀疏注意力机制。这些创新设计旨在提高模型的计算效率和推理能力,使其能够更好地处理复杂系统工程和长周期智能体任务。相比传统的密集注意力机制,稀疏注意力机制可以显著降低计算成本,提升处理长序列数据的能力。 在实际应用能力上,GLM-5显示出了多维度的优势。在编程任务中,该模型能够理解复杂代码逻辑、生成高质量代码片段,这对开发者工具和自动化编程领域至关重要。在智能体任务上,GLM-5可以支持多步骤推理和决策,适应需要长期规划的复杂场景。在推理能力上,模型表现出了较强的逻辑分析和问题求解能力。根据全球权威评测机构Artificial Analysis的最新榜单,GLM-5在开源模型中排名第一,全球排名第四,这充分验证了其技术水平。 这一成果的取得,反映了国内大模型技术的快速进步。开源模型的发展对整个人工智能生态具有重要意义。通过开源,开发者和研究机构可以基于这些模型进行二次开发和创新,加速应用落地。GLM-5的发布,为国内外开发者提供了一个高性能的开源选择,有助于降低大模型应用的门槛,促进人工智能技术的民主化。 同时,GLM-5的推出也有实际应用中的考验。模型的性能优势需要在具体的产业场景中得到验证,包括在金融、制造、医疗等领域的适配性和稳定性。此外,如何在保证性能的同时控制模型的部署成本和能耗,也是后续需要关注的问题。

GLM-5的发展表明,大模型正从规模扩张转向工程能力建设。未来需要在评测标准、工程落地与治理体系上联合推进,才能实现技术的持续进步和实际应用。