中国的芯片堆叠策略能否真正挑战英伟达的AI主导地位? - AI News
中国的芯片堆叠策略能否真正挑战英伟达的AI主导地位?

中国的芯片堆叠策略能否真正挑战英伟达的AI主导地位?

2025-12-03

新闻要点

近期,中国研究者提出芯片堆叠策略应对美国半导体限制,通过将14nm 逻辑芯片与18nm DRAM 用3D 混合键合技术垂直堆叠,结合软件定义近存计算,试图追赶英伟达AI 芯片性能,但该策略宣称的120 TFLOPS 性能与英伟达A100 的312 TFLOPS 存在差距,可行性仍受关注。

- 芯片堆叠策略:14nm 逻辑芯片+18nm DRAM(3D 混合键合)

- 性能对比:Wei 宣称120 TFLOPS vs 英伟达A100 的312 TFLOPS

- 战略转向:避开先进制程竞争,聚焦系统架构优化

- 生态规避:试图绕开英伟达CUDA 软件生态依赖

- 技术基础:3D 堆叠技术全球应用,创新在架构层面

主要内容

# 中国芯片堆叠策略应对美限制 性能差距待解

面对美国半导体技术出口管制,中国正探索“芯片堆叠策略”作为创新应对。该策略核心是通过堆叠国内可生产的成熟芯片,而非直接追赶先进制程,以规避技术封锁。

清华大学教授、中国半导体行业协会副理事长魏少军提出,采用14纳米逻辑芯片与18纳米DRAM通过3D混合键合技术垂直堆叠,构建“软件定义近存计算”架构。该方案利用中国厂商仍可实现的技术边界,通过亚10微米铜-铜直接连接消除数据传输瓶颈,缩短处理器与内存间的物理距离。

魏少军称,此架构可媲美Nvidia 4nm GPU,达到2 TFLOPS/W能效比及120 TFLOPS算力,但对比Nvidia A100的312 TFLOPS,实际性能差距超2.5倍。这一差距凸显先进制程(如更小晶体管尺寸)在能效、密度和散热上的不可替代性。

战略层面,该策略旨在避开TSMC、三星主导的3nm/2nm制程竞争,转而通过系统架构与软件优化构建差异化优势。同时可规避对Nvidia CUDA软件生态的依赖,为中国AI芯片发展提供新路径。

尽管3D堆叠技术在存储等领域已有应用,但其能否填补先进制程性能鸿沟仍存疑。中国芯片产业需在硬件架构创新与实际性能验证中寻找平衡。