Cursor 发布了 Composer 2 的详细技术报告,首次公开其完整训练方案。
核心架构与训练
- 底座模型:采用 MoE 架构的 Kimi K2.5,总参数量达 1.04 万亿,激活参数量为 320 亿。
- 两阶段训练:
- 继续预训练:在代码数据上进行,以增强模型的编码知识。
- 强化学习训练:在完全模拟真实 Cursor 使用场景的 RL 环境中进行,涵盖文件编辑、终端操作、代码搜索等工具调用,使模型在接近生产环境的条件下学习。
性能评估与优势
- 自研基准:构建了 CursorBench 基准,其任务直接采集自工程团队的真实编码会话,而非人工构造。
- 性能飞跃:底座模型 Kimi K2.5 在该基准上得分为 36.0,而经过两阶段训练后的 Composer 2 得分达到 61.3,性能提升约 70%。
- 成本优势:据报告称,Composer 2 在保持高准确率的同时,其推理成本显著低于 GPT-5.4 和 Claude Opus 4.6 等前沿模型 API,实现了准确率与成本之间的帕累托最优。