主要内容
山姆·奥特曼今日透露,OpenAI 将在未来几个月发布一个开放权重的人工智能模型。CEO 在 X 平台上写道:“我们很兴奋在未来几个月推出一个具有推理能力的强大新开放权重语言模型。”这一举动部分是对中国公司 DeepSeek 的 R1 模型取得巨大成功以及 Meta 的 Llama 模型受欢迎程度的回应。DeepSeek 的模型 1 月发布后不久,奥特曼就表示,在开放模型方面,OpenAI“站在了历史的错误一边”,这暗示着可能会改变方向。周一他表示,公司已经考虑发布开放权重模型有一段时间了,并补充说“现在觉得有必要这样做”。OpenAI 可能觉得有必要证明它可以以低成本训练这个新模型,因为 DeepSeek 的模型据称是以大多数大型 AI 模型成本的一小部分进行训练的。专注于托管开放 AI 模型的 HuggingFace 联合创始人兼 CEO 克莱门特·德兰格告诉《连线》杂志:“这是令人惊叹的消息。随着 DeepSeek 的出现,每个人都意识到了开放权重的力量。”OpenAI 目前通过聊天机器人和云端提供其 AI。R1、Llama 和其他开放权重模型可以免费下载并修改。模型的权重指的是大型神经网络内部的值——这是在训练期间设置的。开放权重模型使用成本更低,也可以针对敏感用例进行定制,如处理高度机密信息。OpenAI 的技术人员史蒂文·海德尔转发了奥特曼的公告,并补充说:“我们今年将发布一个你可以在自己的硬件上运行的模型。”OpenAI 从事 AI 安全研究的研究员约翰内斯·海德克也在 X 上转发了这条消息,并表示公司将进行严格测试,以确保开放权重模型不会轻易被滥用。一些 AI 研究人员担心,开放权重模型可能会帮助犯罪分子发动网络攻击,甚至开发生物或化学武器。海德克写道:“虽然开放模型带来了独特的挑战,但我们将遵循我们的准备框架,不会发布我们认为会带来灾难性风险的模型。”OpenAI 今天还发布了一个网页,邀请开发者申请提前访问即将推出的模型。奥特曼在他的帖子中表示,公司将在未来几周为拥有新模型早期原型的开发者举办活动。Meta 是第一家采取更开放方法的大型 AI 公司,于 2023 年 7 月发布了 Llama 的第一个版本。现在有越来越多的开放权重 AI 模型可供使用。一些研究人员指出,Llama 和其他一些模型并不像它们可以的那样透明,因为训练数据和其他细节仍被保密。Meta 还实施了一项许可证,限制了其他公司从使用 Llama 构建的应用和工具中获利的能力。更新日期:2025 年 3 月 31 日,东部标准时间 4:21:本文已更新,增加了 HuggingFace 联合创始人兼 CEO 克莱门特·德兰格的评论。