主要内容
自 1 月 DeepSeek 崭露头角以来,围绕开源中文人工智能模型的势头不断增长。一些研究人员正在推动一种更开放的人工智能构建方法,使模型制作能够在全球范围内分布。专注于去中心化人工智能的初创公司 Prime Intellect 目前正在使用一种新型分布式强化学习进行微调,训练一种前沿的大型语言模型 INTELLECT - 3。该公司首席执行官 Vincent Weisser 表示,该模型将展示一种使用不同地点的各种硬件构建有竞争力的开源人工智能模型的新方式,且不依赖大型科技公司。
Weisser 称,当前的人工智能世界分为依赖封闭美国模型和使用开源中国产品的两类。Prime Intellect 开发的技术通过让更多人自行构建和修改高级人工智能,实现了人工智能的民主化。如今的前沿模型在预训练过程完成后使用强化学习来改进。想要模型擅长数学、回答法律问题或玩数独?让它在可以衡量成败的环境中练习来自我提升。
Weisser 告诉我:“这些强化学习环境现在是真正扩展能力的瓶颈。”Prime Intellect 创建了一个框架,让任何人都可以为特定任务创建定制的强化学习环境。该公司正在将其团队和社区创建的最佳环境结合起来调整 INTELLECT - 3。我尝试运行了由 Prime Intellect 研究人员 Will Brown 创建的用于解决 Wordle 谜题的环境,看着一个小模型解决了 Wordle 谜题(说实话,它比我更有条理)。如果我是一名试图改进模型的人工智能研究人员,我会启动一堆 GPU,让模型反复练习,同时强化学习算法修改其权重,从而将模型变成 Wordle 大师。
尽管强化学习现在非常重要,但大多由大型人工智能公司在幕后进行。这一过程通常需要大量专业知识,使大多数公司和开发人员望而却步。Weisser 表示,允许初创公司进行自己的强化学习可能会产生有价值的新软件产品,包括专门用于各种任务的代理。一些专家对此表示赞同。特斯拉前人工智能团队负责人 Andrej Karpathy 在宣布后不久将 Prime Intellect 的强化学习环境描述为“一项伟大的努力和想法”。他鼓励开源研究人员采用不同的环境并将其适应新任务,以新的方式提高高级模型的技能。
Prime Intellect 已经表明,包括划分计算然后组合以创建单个更大模型的分布式方法,可以挑战传统的人工智能构建方式。2024 年底,该公司宣布了 INTELLECT - 1,这是一个用分布式硬件训练的 100 亿参数模型。3 月,它推出了一个更大、更强大的模型 INTELLECT - 2,其推理能力通过分布式强化学习实现。在过去的两年中,人工智能领域发生了巨大变化。Meta 在 2023 年发布了其 Llama 模型的第一版,开启了开源人工智能时代,但该公司 2025 年 4 月宣布的最新产品却令人大失所望。与此同时,鲜为人知的中国初创公司 DeepSeek 在 2025 年 1 月推出了一个有能力、低成本的推理模型,其他几个中国人工智能模型也纷纷效仿。OpenAI 今年 8 月对 DeepSeek 的成功做出回应,推出了多年来的第一个开源模型,但像阿里巴巴的 Qwen、Moonshot 的 Kimi 和 DeepSeek 的 R1 等中国模型证明更受欢迎。