主要内容
OpenAI因基础设施成本高企开发定制芯片Jalapeño。英伟达高端处理器利润率约75%,而OpenAI每1美元收入扣除成本后仅约33美分利润。去年运行ChatGPT服务器成本达84亿美元,今年预计增至140亿美元,未来8年计划投入1.4万亿美元算力,远超其年营收250亿美元。
Jalapeño是OpenAI首个“智能处理器”,专为大语言模型(LLM)推理设计,非通用AI工作负载。OpenAI主导架构设计,博通负责硅工程与网络集成,台积电负责制造,Celestica承担板架系统组装。
该架构通过最小化数据移动提升资源利用率,集成博通Tomahawk网络硅,优化计算、内存与网络资源平衡,解决LLM服务的通信瓶颈。早期实验室样品已在目标频率和功耗下运行前沿工作负载,包括未发布的GPT-5.3模型。
OpenAI从纯软件层转向垂直整合,类似苹果全栈模式,通过优化全栈资源降低成本、提升产品体验,反哺下一代定制基础设施研发。
为追赶谷歌TPU、亚马逊定制芯片等对手,OpenAI加速全栈布局,Jalapeño是其提升算力效率的关键一步。