人工智能悬赏计划向漏洞猎手最高支付 3 万美元

2025-10-06

新闻要点

周一 Google 推出专门针对 AI 产品找漏洞的奖励计划。此计划明确 AI 漏洞定义，已让猎手获超 43 万美元。同时推出 AI 代理 CodeMender。“旗舰”产品找漏洞最高奖 3 万美元，其他产品奖金降低。该计划旨在提升 AI 产品安全性，推动安全研究发展。

- Google 推 AI 漏洞奖励计划最高奖 3 万美元

- 猎手两年从 Google AI 漏洞研究获超 43 万美元

- Google 推出可修复漏洞代码的 AI 代理 CodeMender

主要内容

周一，谷歌推出了一项新的奖励计划，专门用于发现人工智能产品中的漏洞。谷歌的合格漏洞列表包括它正在寻找的恶意行为示例，如间接注入导致谷歌 Home 解锁门的人工智能提示，或数据泄露提示注入，将某人的所有电子邮件摘要发送到攻击者自己的账户。

新计划明确了什么构成人工智能漏洞，将其细分为利用大型语言模型或生成式人工智能系统造成伤害或利用安全漏洞的问题，其中恶意行为位居榜首。这包括修改某人的账户或数据以妨碍其安全或做一些不必要的事情，如之前暴露的一个漏洞，可利用中毒的谷歌日历事件打开智能百叶窗并关闭灯光。

自该公司正式开始邀请人工智能研究人员找出其产品中滥用人工智能功能的潜在途径以来的两年内，漏洞猎手已获得超过 43 万美元的奖励。仅仅让 Gemini 产生幻觉是不够的。该公司表示，与人工智能产品生成的内容相关的问题，如生成仇恨言论或侵犯版权的内容，应报告给产品本身的反馈渠道。据谷歌称，这样其人工智能安全团队可以“诊断模型的行为并实施必要的长期、模型范围的安全培训”。

周一，谷歌还宣布了一项名为 CodeMender 的人工智能代理，用于修补易受攻击的代码。该公司表示，在经过人工研究人员审查后，已使用它修补了“开源项目的 72 个安全补丁”。发现谷歌“旗舰”产品搜索、Gemini 应用以及 Gmail 和云端硬盘等核心工作区应用中的恶意行为可获得 2 万美元的奖励。还提供报告质量的乘数和新奇奖金，这可能会使总金额达到 3 万美元。在谷歌的其他产品（如 Jules 或 NotebookLM）以及较低级别的滥用（如窃取秘密模型参数）上发现的漏洞，奖励金额会降低。

人工智能悬赏计划向漏洞猎手最高支付 3 万美元

新闻要点

主要内容

关于我们