老代码库里藏着的漏洞比谁都多!

科技发展飞速,AI在软件漏洞检测上大显神通,这事咱得留心。就在最近,微软Azure的大佬马克·鲁西诺维奇把他的旧活儿拿了出来。1986年他在Apple II上写了点汇编代码,用的还是6502处理器。他把这段老古董丢给了Anthropic的Claude Opus 4.6去琢磨。没想到啊,Claude不光能看懂代码,还顺手把这老玩意儿来了个“安全体检”,居然揪出了一堆藏了几十年的逻辑毛病,比如那个算术运算后没查进位标志的茬儿。最让人想不到的是,这段代码是在现代编程语言和安全检查清单出现以前编出来的。但AI硬是靠自己的本事,把低级控制流和CPU标志给推理出来了。这下子可好了,把经验丰富的开发人员都给震住了:咱们的老代码库下面,藏着的漏洞比谁都多!虽然AI找漏洞很厉害,但专家们也在犯嘀咕。有人说,这下可好,攻击面直接扩大到了所有曾经发布过的二进制文件上。你想想看,AI都能把40年前的架构逆向工程得那么透彻,咱们现在搞的那些模糊处理和防护手段,基本上也就没啥用了。Lendsqr的创始人阿德德吉·奥洛维也跟着吐槽说:这事儿比咱们想的要吓人多了!全球有数十亿个老式微控制器还在转呢,里面跑的固件可能都不安全、不严谨。传统的静态分析工具SpotBugs、CodeQL和Snyk Code对付已知问题还行,现在这些大型语言模型(LLMs)也开始加入战局了。到了2025年有个研究显示:像GPT-4.1、Mistral Large和DeepSeek V3这些模型在找开源项目漏洞时,本事跟行业里的老大哥们差不了多少。它们就像有了心眼儿一样问:“系统功能是这么设计的吗?这里会不会出故障?能不能被人给攻击?”比如Anthropic的Claude Opus 4.6正在帮着清理Firefox的代码呢。Mozilla那边也说了:Anthropic的红队用了不到两周时间发现的高严重性漏洞数量,比大家平常两个月都没报的还多!这就说明AI辅助的大规模分析是个好帮手。不过咱们也不能完全指望它。研究发现啊,虽然这些大模型找漏很准,但它们也爱犯低级错误。像密码处理不安全、对象引用出岔子这种事儿都有发生。CodeRabbit的调查显示:有些漏洞人类容易犯错而AI少犯;反过来也有一些人类不容易出的错却是AI干出来的。整体来说呢,AI造的漏洞数量比人类多出1.7倍;而且产生的严重问题也多1.3到1.7倍呢。cURL那个程序的创始人丹尼尔·斯滕伯格气得不行:他的项目被一堆假的AI报告给淹没了!维护者们都快忙疯了。总的来说啊,AI得放在合适的地方才能当助手。现在要想让它取代顶级程序员或者安全检查员?那还是太早太早了点。所以啊咱们得好好琢磨琢磨怎么跟现有的工具搭配使用才能更安全点。特别是那些旧代码和固件设备的安全隐患问题?以后肯定会有更多人因为怕出事而选择换新的了!