泄密显示开源人工智能模型即将发布

2025-08-01

新闻要点

有泄露迹象显示OpenAI可能数小时内发布强大开源AI模型。此次发布或回归开源初心，模型采用MoE架构等设计，有竞争优势。若属实，将是AI领域里程碑事件。

- OpenAI 或很快推出开源AI模型

- 模型采用 MoE 架构且词汇量大

- 此举或回归开源并具竞争考量

主要内容

有消息泄露称，OpenAI 即将推出一款强大的新开源 AI 模型，可能在数小时内。证据来自一系列数字线索，被开发者热切研究。核心是显示一系列模型仓库的截图，如 yofo-deepcurrent/gpt-oss-120b 和 yofo-wildflower/gpt-oss-20b。这些仓库已被删除，但账户中有 OpenAI 团队成员。“gpt-oss”标签是确凿证据，似乎是“GPT 开源软件”的明确路标。对于一直严格保护顶级模型的公司来说，这算是回归本源。看到多个版本，有不同代号和规模，表明一系列精心规划的模型即将亮相。多亏一份泄露的配置文件，我们甚至能窥探到疑似 1200 亿参数版本的内部。该模型似乎基于专家混合（MoE）架构，不像单个庞大的大脑试图知晓一切，更像 128 位专家顾问组成的委员会。收到查询时，系统会智能选择四位最适合的专家。这使模型拥有巨大参数带来的丰富知识，又有小得多系统的速度和敏捷性，因为任何时候只有一小部分在工作。这种设计使 OpenAI 的开源 AI 模型直接与该领域的宠儿如 Mistral AI 的 Mixtral 和 Meta 的 Llama 系列竞争。规格不止于此，OpenAI 的开源 AI 模型似乎拥有巨大词汇量，能更高效处理更广泛的语言，使用滑动窗口注意力轻松处理长文本流。实际上，这表明该模型既强大又易于运行。那么，OpenAI 为何现在采取此举？多年来，该公司因偏离更开放的起点而面临温和指责和严厉批评。推出强大的 gpt-oss 将是一场大规模的魅力攻势，直接针对感到被抛弃的开发者和研究人员。当然，这也是精明的竞争之举。Meta 和 Mistral 已展示开源生态系统如何推动创新。通过投放这样一款强大的开源 AI 模型，OpenAI 不仅参与竞争，还试图重新定义赛道。在收到 OpenAI 的官方消息之前，这在技术上仍只是传闻，但有代码和配置文件支持，是有实质内容的传闻。从最著名的 AI 公司推出高性能 1200 亿参数开源 MoE 模型将是一个里程碑式事件，且似乎即将到来。（照片由 Mariia Shalabaieva 拍摄）

泄密显示开源人工智能模型即将发布

新闻要点

主要内容

关于我们