泄密显示开源人工智能模型即将发布 - AI News
泄密显示开源人工智能模型即将发布

泄密显示开源人工智能模型即将发布

2025-08-01

新闻要点

有泄露迹象显示OpenAI可能数小时内发布强大开源AI模型 。此次发布或回归开源初心,模型采用MoE架构等设计,有竞争优势。若属实,将是AI领域里程碑事件。

- OpenAI 或很快推出开源AI模型

- 模型采用 MoE 架构且词汇量大

- 此举或回归开源并具竞争考量

主要内容

有消息泄露称,OpenAI 即将推出一款强大的新开源 AI 模型,可能在数小时内。证据来自一系列数字线索,被开发者热切研究。核心是显示一系列模型仓库的截图,如 yofo-deepcurrent/gpt-oss-120b 和 yofo-wildflower/gpt-oss-20b。这些仓库已被删除,但账户中有 OpenAI 团队成员。“gpt-oss”标签是确凿证据,似乎是“GPT 开源软件”的明确路标。对于一直严格保护顶级模型的公司来说,这算是回归本源。看到多个版本,有不同代号和规模,表明一系列精心规划的模型即将亮相。多亏一份泄露的配置文件,我们甚至能窥探到疑似 1200 亿参数版本的内部。该模型似乎基于专家混合(MoE)架构,不像单个庞大的大脑试图知晓一切,更像 128 位专家顾问组成的委员会。收到查询时,系统会智能选择四位最适合的专家。这使模型拥有巨大参数带来的丰富知识,又有小得多系统的速度和敏捷性,因为任何时候只有一小部分在工作。这种设计使 OpenAI 的开源 AI 模型直接与该领域的宠儿如 Mistral AI 的 Mixtral 和 Meta 的 Llama 系列竞争。规格不止于此,OpenAI 的开源 AI 模型似乎拥有巨大词汇量,能更高效处理更广泛的语言,使用滑动窗口注意力轻松处理长文本流。实际上,这表明该模型既强大又易于运行。那么,OpenAI 为何现在采取此举?多年来,该公司因偏离更开放的起点而面临温和指责和严厉批评。推出强大的 gpt-oss 将是一场大规模的魅力攻势,直接针对感到被抛弃的开发者和研究人员。当然,这也是精明的竞争之举。Meta 和 Mistral 已展示开源生态系统如何推动创新。通过投放这样一款强大的开源 AI 模型,OpenAI 不仅参与竞争,还试图重新定义赛道。在收到 OpenAI 的官方消息之前,这在技术上仍只是传闻,但有代码和配置文件支持,是有实质内容的传闻。从最著名的 AI 公司推出高性能 1200 亿参数开源 MoE 模型将是一个里程碑式事件,且似乎即将到来。(照片由 Mariia Shalabaieva 拍摄)