主要内容
阿拉伯联合酋长国发布了一个开源模型,其能进行高级推理,性能可与美国和中国的最佳产品相媲美,这是该国在人工智能领域大量投资开始获得回报的最有力迹象之一。
新模型 K2 Think 来自位于阿联酋首都阿布扎比的穆罕默德·本·扎耶德人工智能大学(MBZUAI)的研究人员。该模型是首批所谓的主权人工智能模型之一,融合了推理所需的技术进步,由阿布扎比主权财富基金支持的阿联酋科技集团 G42 免费提供。G42 在一组 Cerebras 芯片上运行该模型,Cerebras 芯片是英伟达硬件的替代品。
K2 Think 是阿联酋在全球竞争中展示在一项预计将产生巨大经济和地缘政治影响的技术方面实力的贡献之一。美国和中国被认为是这场竞赛的主导者,但许多较小的国家,特别是那些有大量资金投资的国家,也在竞相开发自己的“主权”人工智能模型。K2 Think 的规模相对较小,有 320 亿个参数。它不是一个完整的大型语言模型,而是一个专门用于推理的模型,能够通过模拟的审议来回答复杂问题,而不是快速合成信息以提供输出。研究人员表示,在这类任务上,它的性能与拥有超过 2000 亿个参数的 OpenAI 和 DeepSeek 的推理模型相当。
MBZUAI 校长兼首席人工智能研究员 Eric Xing 在今天宣布之前告诉《连线》杂志:“这是一项技术创新,或者在我看来,是一种颠覆。”Xing 表示,该模型展示了一系列最近技术创新的特别有效组合,包括对长串模拟推理的微调、以不同方式分解问题的代理规划过程以及训练模型以达到可验证正确答案的强化学习。其他创新使该模型能够在 Cerebras 芯片上非常高效地运行。
Xing 补充说,K2 Think 是使用数千个 GPU 开发的(他拒绝给出确切数字),最终的训练运行涉及 200 到 300 个芯片。计划在未来几个月将 K2 Think 整合到一个完整的大型语言模型中。MBZUAI 已经开源了该模型,并发布了一份技术报告,详细介绍了如何将不同的创新结合起来创建它。
中东其他国家,包括沙特阿拉伯,也在大力投资人工智能基础设施和研究。唐纳德·特朗普总统 5 月前往该地区,宣布了涉及美国科技公司的众多人工智能交易。阿联酋领导层已投资数十亿美元,将自己确立为具有战略重要性的研究中心。该国已经展示了一些前沿的人工智能研究,并在硅谷设立了一个据点。阿联酋为了获得训练前沿模型所需的美国硅,减少了与中国的联系。
G42 首席执行官 Peng Xiao 也是 MBZUAI 董事会成员,他在一份声明中表示:“通过证明更小、更有资源的模型可以与最大的系统相媲美,这一成就表明阿布扎比如何塑造下一波全球创新。”