主要内容
蚂蚁集团携新开源语言模型 Ling-1T 进入万亿参数 AI 模型领域,该模型被定位为在计算效率与先进推理能力之间取得平衡的突破。10 月 9 日的宣布是支付宝运营商的重要里程碑,其一直在多个模型架构中快速构建人工智能基础设施。
万亿参数 AI 模型在复杂数学推理任务中展现出竞争性能,在 2025 年美国数学邀请赛(AIME)基准测试中达到 70.42%的准确率,用于评估 AI 系统的解决问题能力。据蚂蚁集团技术规格,Ling-1T 在每个问题平均消耗 4000 多个输出标记的情况下保持此性能水平,在结果质量方面可与公司所称的“一流 AI 模型”相媲美。
AI 推进的双管齐下策略:万亿参数 AI 模型发布之际,蚂蚁集团推出了专为扩散语言模型设计的专用推理框架 dInfer。这种并行发布策略反映了公司对多种技术方法而非单一架构范式的押注。扩散语言模型与支持 ChatGPT 等广泛使用的聊天机器人的自回归系统不同,它以并行方式生成输出,这种方法在图像和视频生成工具中已很普遍,但在语言处理中较少见。蚂蚁集团对 dInfer 的性能指标显示出效率大幅提升,在 HumanEval 编码基准测试中,其 LLaDA-MoE 扩散模型每秒生成 1011 个标记,而英伟达的 Fast-dLLM 框架为每秒 91 个,阿里巴巴的 Qwen-2.5-3B 模型在 vLLM 基础设施上为每秒 294 个。
蚂蚁集团研究人员在相关技术文档中指出:“我们认为 dInfer 为加速快速增长的扩散语言模型领域的研究和开发提供了实用工具和标准化平台。”
语言模型之外的生态系统扩展:Ling-1T 万亿参数 AI 模型是蚂蚁集团近几个月来组装的更广泛 AI 系统家族的一部分。该公司的产品组合现在涵盖三个主要系列:用于标准语言任务的 Ling 非思维模型、专为复杂推理设计的 Ring 思维模型(包括先前发布的 Ring-1T-preview)以及能够处理图像、文本、音频和视频的 Ming 多模态模型。这种多样化方法还延伸到实验模型 LLaDA-MoE,它采用专家混合(MoE)架构,该技术仅为特定任务激活大型模型的相关部分,理论上提高了效率。
蚂蚁集团首席技术官何正宇阐述了公司在这些发布方面的定位:“在蚂蚁集团,我们认为通用人工智能(AGI)应该是一种公共利益——人类智能未来的共同里程碑。”他补充说,万亿参数 AI 模型和 Ring-1T-preview 的开源发布是朝着“开放和协作进步”迈出的一步。
受限环境中的竞争动态:蚂蚁集团发布的时机和性质揭示了中国 AI 领域的战略考量。由于出口限制限制了对前沿半导体技术的访问,中国科技公司越来越强调算法创新和软件优化作为竞争差异化因素。TikTok 母公司字节跳动 7 月也推出了名为 Seed Diffusion Preview 的扩散语言模型,声称比同类自回归架构速度提高了五倍。这些并行努力表明,中国科技公司在受限环境中积极探索和创新,以在 AI 领域取得竞争优势。