北京发布人工智能前沿成果：安全评估体系与基座平台入列，构筑治理“底座”护航应用落地

在人工智能技术加速演进的当下,如何兼顾创新活力与安全底线,成为全球科技治理面临的共同课题。

1月5日举行的2026北京人工智能创新高地建设推进会释放出明确信号:北京正以安全治理能力建设为抓手,探索人工智能发展的中国方案。

会上公布的八大前沿成果中,由北京前瞻人工智能安全与治理研究院开发的安全评估体系与基座平台格外引人关注。

这一创新成果突破了传统安全评估的单一视角,构建起涵盖基础安全、具身智能安全、科学智能安全、社会安全、环境安全以及灾难性与生存性风险的六维评估体系。

该框架将评估范围延伸至教育科研、医疗健康、金融经济、信息传媒、工业基建、政务民生等关键应用场景,形成了全领域、多层次的安全治理架构。

在评估重点方面,该体系聚焦当前人工智能发展中的核心风险点,针对隐私与数据保护、技术滥用、身心伤害、虚假信息传播、自主系统高阶风险等突出问题,开展系统化的识别与防范工作。

这种精准定位源于研究机构对行业现状的深入洞察。

值得关注的是,研究团队通过大规模测试发现了一个令人警醒的现象:近年来新发布的大型模型在安全性能上并未呈现同步提升态势,部分新近模型面对恶意攻击时的脆弱性反而有所增加。

这一发现揭示出当前人工智能研发中存在的失衡倾向——技术能力的跃升未能与安全防护水平形成协同进步。

然而研究同时验证了一条具有实践价值的技术路径:提升模型安全水平并非只能依赖重新训练这一高成本方式。

通过在推理阶段部署安全护栏机制,即可实现对模型安全性能的显著改善。

这一结论为产业界提供了更具可操作性的解决思路,有助于降低安全加固的技术门槛与经济成本。

基于评估体系的研究成果,研究院推出了两大核心应用平台。

其中"前瞻·灵御"平台专注于安全攻防能力建设,为企业提供标准化评估流程与系统化安全分析,帮助使用方精准识别模型存在的安全隐患,并获取针对性的防御方案与加固建议。

该平台的投入使用,有望推动人工智能安全评估从经验判断走向科学测量。

另一平台"前瞻·灵度"则着眼于伦理层面的价值校准。

该平台具备对上百个大型模型实施实时监控与并行测试的能力,可从六大维度、九十个细分类别评估模型的伦理合规水平。

平台整合了以中国价值观为核心的大规模语料库,涵盖三个层面、十二项核心价值、五十项衍生价值,累计收录超过二十五万条规则;同时纳入全球二百余项伦理原则、四十余项中英文法律法规与国际公约,为多元化场景提供精准的合规指引。

该平台已可对人工智能、数据安全、神经科学、脑机接口、医疗健康、生物安全、危险化学物质、核物质、自动驾驶等多个敏感领域实施自动化伦理评估。

研究机构明确提出,人工智能安全应当确立为"第一性原理",成为技术研发与应用推广中不可逾越的底线要求。

这一理念将安全治理从附加选项提升至基础性工程,体现了对技术伦理的深刻认知。

从更宏观的视角来看,安全治理能力基座的构建,不仅关系到北京建设人工智能创新高地的战略目标,更承载着为全球人工智能治理贡献中国智慧的使命担当。

唯有夯实安全根基,方能确保人工智能技术在现代化建设中发挥积极作用,让发展成果惠及更广泛人群。

人工智能安全治理是技术发展的永恒命题。

北京此次发布的评估体系，不仅为解决当下安全问题提供了方案，更为构建面向未来的人工智能治理体系奠定了基础。

在科技革命与产业变革加速演进的时代背景下，坚持安全与发展并重，方能让技术创新更好造福人类。

这一探索实践，彰显了中国推动人工智能健康发展的决心与智慧。