我国自主研发大模型技术取得重大突破 GLM-5开源系统性能达国际领先水平

当前，大模型技术已成为推动人工智能发展的核心驱动力。开源模型领域，如何突破性能瓶颈、提升实际应用能力，成为业界关注的焦点。智谱AI近日发布的GLM-5大模型，在这个方向上做出了有益探索。 GLM-5在规模和数据上实现了明显提高。该模型参数扩展至744亿，其中激活参数为40亿，相比前代产品有了质的飞跃。预训练数据量从23万亿提升至28.5万亿，数据规模的增加为模型性能提升奠定了基础。这种参数和数据的双重扩展，反映了开源模型在追求性能极限上的持续努力。技术创新是GLM-5的核心竞争力。该模型引入了全新的"Slime"框架和异步强化学习算法，同时采用稀疏注意力机制。这些创新设计旨在提高模型的计算效率和推理能力，使其能够更好地处理复杂系统工程和长周期智能体任务。相比传统的密集注意力机制，稀疏注意力机制可以显著降低计算成本，提升处理长序列数据的能力。在实际应用能力上，GLM-5显示出了多维度的优势。在编程任务中，该模型能够理解复杂代码逻辑、生成高质量代码片段，这对开发者工具和自动化编程领域至关重要。在智能体任务上，GLM-5可以支持多步骤推理和决策，适应需要长期规划的复杂场景。在推理能力上，模型表现出了较强的逻辑分析和问题求解能力。根据全球权威评测机构Artificial Analysis的最新榜单，GLM-5在开源模型中排名第一，全球排名第四，这充分验证了其技术水平。这一成果的取得，反映了国内大模型技术的快速进步。开源模型的发展对整个人工智能生态具有重要意义。通过开源，开发者和研究机构可以基于这些模型进行二次开发和创新，加速应用落地。GLM-5的发布，为国内外开发者提供了一个高性能的开源选择，有助于降低大模型应用的门槛，促进人工智能技术的民主化。同时，GLM-5的推出也有实际应用中的考验。模型的性能优势需要在具体的产业场景中得到验证，包括在金融、制造、医疗等领域的适配性和稳定性。此外，如何在保证性能的同时控制模型的部署成本和能耗，也是后续需要关注的问题。

GLM-5的发展表明，大模型正从规模扩张转向工程能力建设。未来需要在评测标准、工程落地与治理体系上联合推进，才能实现技术的持续进步和实际应用。