主要内容
最新的人工智能模型不仅在软件工程方面表现出色,新研究表明它们在发现软件漏洞方面也越来越擅长。加州大学伯克利分校的人工智能研究人员测试了最新的人工智能模型和代理在 188 个大型开源代码库中发现漏洞的能力。使用名为 CyberGym 的新基准,人工智能模型识别出 17 个新漏洞,包括 15 个以前未知的“零日”漏洞。领导这项工作的加州大学伯克利分校教授 Dawn Song 说:“许多这些漏洞是关键的。”许多专家预计人工智能模型将成为强大的网络安全武器。初创公司 Xbow 的一个人工智能工具目前在 HackerOne 的漏洞狩猎排行榜上攀升,并位居榜首。该公司最近宣布获得 7500 万美元的新资金。Song 表示,最新人工智能模型的编码技能与不断提高的推理能力相结合,开始改变网络安全格局。她说:“这是一个关键时刻。它实际上超出了我们的一般预期。”随着模型的不断改进,它们将自动化发现和利用安全漏洞的过程。这可以帮助公司保持其软件安全,但也可能帮助黑客入侵系统。Song 说:“我们甚至没有那么努力。如果我们增加预算,让代理运行更长时间,它们可以做得更好。”加州大学伯克利分校团队测试了来自 OpenAI、谷歌和 Anthropic 的传统前沿人工智能模型,以及来自 Meta、DeepSeek 和阿里巴巴的开源产品,并结合了几个用于发现漏洞的代理,包括 OpenHands、Cybench 和 EnIGMA。研究人员使用了 188 个软件项目中已知软件漏洞的描述。然后,他们将这些描述提供给由前沿人工智能模型提供支持的网络安全代理,以查看它们是否可以通过分析新代码库、运行测试和制作概念验证漏洞利用来自己识别相同的漏洞。该团队还要求代理自己在代码库中寻找新的漏洞。通过这个过程,人工智能工具生成了数百个概念验证漏洞利用,研究人员在这些漏洞利用中识别出 15 个以前未见过的漏洞和两个以前已披露并修补的漏洞。这项工作增加了越来越多的证据,表明人工智能可以自动化发现零日漏洞,这些漏洞可能是危险的(且有价值的),因为它们可能提供一种入侵实时系统的方法。然而,人工智能似乎注定要成为网络安全行业的重要组成部分。安全专家 Sean Heelan 最近在 OpenAI 的推理模型 o3 的帮助下发现了广泛使用的 Linux 内核中的一个零日漏洞。去年 11 月,谷歌宣布通过一个名为 Project Zero 的程序使用人工智能发现了一个以前未知的软件漏洞。像软件行业的其他部分一样,许多网络安全公司都对人工智能的潜力着迷。这项新工作确实表明,人工智能可以常规地发现新的漏洞,但它也突出了该技术仍然存在的局限性。人工智能系统无法找到大多数漏洞,并且被特别复杂的漏洞难住。Luta Security 的创始人兼首席执行官 Katie Moussouris 说:“这项工作很棒,部分原因是它表明人工智能仍然无法与人类专业知识相媲美——模型和代理组合(Claude 和 OpenHands)的最佳组合只能找到大约 2%的漏洞。”Moussouris 说,她更担心的是公司在人工智能上投入过多,而牺牲了其他技术,而不是人工智能黑客软件。纽约大学坦登分校的副教授、Xbow 的研究员 Brendan Dolan-Gavitt 表示,这项新工作展示了在相对大量的代码中使用广泛的人工智能任务进行现实的零日发现。Dolan-Gavitt 表示,他预计人工智能将在未来发挥更大的作用。