关闭导航

包含标签"陈广宇"的内容

17岁高中生陈广宇成Kimi论文联合一作,获Elon Musk点赞
青岚老师 3 小时前 18 0

月之暗面发布《Attention Residuals》技术报告,提出用注意力机制替代Transformer中固定的残差连接。该技术在Kimi Linear 48B模型上可等效多用25%算力,推理延迟增

sitemap