OpenAI 技术人员 Clive Chan 指出,DeepSeek V4 技术报告的硬件建议章节「出人意料地平庸且有错误」,与 V3 的深度形成反差。V3 的硬件 Q&A 曾在 ISCA 上备受关注,而 V4 建议更空泛。
逐条质疑如下:
- 功耗建议:报告称软件优化让芯片满载运行,建议预留更多电力空间。Chan 认为此举适得其反:物理工艺限制下预留电力需降频,反而削弱算力。
- 数据传输:报告倾向 GPU 主动拉取数据(pull),而非接收推送(push),因 push 通知开销高。Chan 质疑 pull 更慢,应改进网卡处理能力。双方或聚焦不同层面:报告关注通知开销,Chan 在乎传输延迟。
- 激活函数:报告建议用更简单函数替代 SwiGLU。Chan 反驳称,Sonic MoE 已证明 SwiGLU 可达到最优性能,无需替换。
Chan 怀疑 DeepSeek 可能「故意弱化了该章节」。