关闭导航

包含标签"Warp Decode"的内容

Cursor发布Warp Decode技术,Blackwell GPU上MoE推理吞吐量提升1.84倍
青岚老师 5 小时前 17 0

AI编程工具Cursor公开了其自研的MoE(混合专家模型)推理加速技术Warp Decode。该技术专为英伟达Blackwell GPU上的小批量token生成场景设计。 核心创新:以输出为中心的并

sitemap