主要内容
在科技行业,“护城河”(moat)概念正从商业领域渗透到AI赛道。近日一份据传源自Google的备忘录曾担忧:开源AI会冲击大科技公司的“护城河”,但事实是,尽管OpenAI、Anthropic等前沿实验室持续投入,开源AI模型尚未显著超越闭源模型,而真正构建起AI领域护城河的,是NVIDIA的CUDA技术——这被CEO黄仁勋称为“最珍贵的宝藏”。
CUDA(Compute Unified Device Architecture,发音“KOO-duh”)并非硬件,而是一套软件平台,其核心作用是“并行化”计算。以9×9乘法表为例:单核心CPU需81步逐个计算,而配备9核心的GPU可将任务分配给不同核心,每核心处理一列乘法,效率提升9倍;更智能的GPU还能通过识别交换律(如7×9=9×7)减少重复计算,将81步压缩至45步,这对单次成本超千万美元的AI训练至关重要。
CUDA最初为游戏渲染设计,后经斯坦福博士Ian Buck与John Nickolls优化,成为高性能计算的核心工具。它相当于AI训练的“指挥官”:现代GPU虽有张量核心、流式多处理器等硬件,但只有通过CUDA的软件库调度,才能将数百个核心高效分配给矩阵运算等任务,避免资源浪费。
相比之下,开源AI的技术生态难以复制CUDA的深度优化。例如,DeepSeek工程师直接通过PTX(NVIDIA GPU汇编语言)深度调优,进一步压缩计算步骤——这恰如“专业厨房”中为特定任务定制的工具,虽精细却难以替代CUDA的整体生态壁垒。在AI军备竞赛中,CUDA已成为NVIDIA最难以撼动的护城河。