随着人工智能技术的快速迭代发展,其带来的安全风险日益凸显,已成为产业健康发展的重要课题。
北京前瞻人工智能安全与治理研究院近日发布的安全评估体系与基座平台,标志着我国在人工智能安全治理领域取得重要进展,为行业规范发展奠定了坚实基础。
该研究院院长曾毅表示,当前人工智能安全风险呈现多层次、多维度特点,仅依靠传统的单一维度评估已难以满足实际需要。
新发布的"前瞻安全基准"评估体系,在根植基础安全的基础上,创新性地扩展至具身智能安全、科学智能安全、社会安全、环境安全以及灾难性与生存性风险等五大维度,形成了更加系统完善的评估框架。
这一突破性设计充分考虑了人工智能技术在不同应用场景中可能面临的多元风险。
该体系的适用范围广泛而深入。
在教育科研、医疗健康、金融经济、信息传媒、工业基建、政务民生等关键领域,该评估体系均可有效发挥作用。
其重点关注隐私与数据保护、滥用恶用、虚假信息防范等当前行业面临的核心难题,针对性强,实用价值高。
与评估体系相配套,研究院同时推出了"前瞻·灵御"人工智能安全攻防平台。
该平台通过模拟真实的网络攻防场景,对人工智能模型进行全面的安全性能"体检"。
平台目前已支持60余种主流大模型、20余种攻击方法和10余种防御机制,覆盖面不断扩大。
值得关注的是,测试结果显示,近年来发布的大模型在安全性方面并未呈现明显提升趋势,部分新模型甚至面临更高的攻击风险。
这一现象提醒行业,安全防护不能滞后于技术发展。
曾毅指出,强化人工智能模型的防御能力并非必须重新进行模型训练,在部署推理阶段部署有效的安全护栏,同样能够显著提升模型的安全水平。
灵御平台的核心功能,就是通过提供针对性的防御方案和"加固"建议,帮助企业和开发者实现主动防御、精准防护,既提高了防护效率,也降低了防护成本。
除安全防护外,人工智能的伦理治理同样重要。
为此,研究院同步推出了"前�view·灵度"平台,专门聚焦人工智能伦理的智能评估与价值校准。
该平台能够在6个维度、90个细分类别框架下,对上百个大模型进行实时动态监控和测试。
灵度平台的一大创新之处在于其集成了以中国价值观为核心的大规模中文价值语料库,累计定义了25万余条规则。
这一设计有效解决了现有伦理评估中存在的中文价值适应性不足、边界覆盖不全等问题,使评估标准更加符合国情、更具针对性。
从系统层面看,新发布的安全评估体系和基座平台实现了对人工智能安全治理的全链条覆盖。
它不仅明确回答了"评什么、怎么评"的基础问题,还深入解答了"怎样攻、如何防"的核心问题,并通过完善的伦理评估机制,指明了人工智能安全发展的价值导向。
这种系统性、科学性的治理思路,为我国人工智能产业的规范健康发展提供了重要支撑。
人工智能的安全治理是一场与技术演进并行的长跑。
中关村此次创新实践,既为行业树立了风险防控的标杆,也启示我们:唯有技术硬实力与伦理软约束双轮驱动,才能让智能时代的发展行稳致远。
在全球科技竞争格局中,中国正以系统性思维探索出一条兼顾创新与安全的发展路径。