关闭导航

包含标签"KV缓存压缩"的内容

↕️ 2029 史诗级长牛现货建仓实验室

直播中
📅 熊市布局期:2026-04-01 → 2029-12-31(目标牛市)
加载中...
⏳ 距离计划结束还有 00000000
Baseten Still:单次前向传播实现200倍KV缓存压缩
市场资讯部 1 天前 31 0

Baseten 研究团队推出 KV 缓存压缩方案 Still。该方法冻结基座模型参数,仅训练轻量级 Perceiver 压缩器(参数量约为基座模型的 1%),通过一次前向传播即可完成压缩,最高支持 2

Ramp Labs多智能体记忆共享方案,Token消耗最高降低65%
青岚老师 2 个月前 183 0

AI基础设施公司Ramp Labs发布研究成果“Latent Briefing”,通过直接压缩大语言模型的KV缓存,实现多智能体系统间的高效记忆共享,能在不损失准确率的前提下大幅降低Token消耗。

sitemap