MiniMax 发布 M2.7 模型,宣称其为首个深度参与自身迭代过程的模型。
核心突破:模型自主迭代
- 团队基于早期 M2 版本构建研究型 Agent 框架。
- 模型可自主完成强化学习技能构建、记忆更新和过程优化。
- 在一次内部实验中,M2.7 自主运行超 100 轮迭代循环,最终在内部评测上效果提升 30%。
关键性能表现
- 编程能力:在 SWE-Pro 得分 56.22%,追平 GPT-5.3-Codex;VIBE-Pro 得分 55.6%,接近 Opus 4.6。
- 机器学习任务:在 MLE Bench Lite 的 22 个任务中,平均得牌率 66.6%,与 Gemini-3.1 持平。
- 办公场景:在 GDPval-AA ELO 评测中得分 1500,在 45 个模型中位列前茅。
- 复杂指令遵循:对于 40 个复杂技能(>2000 Token),遵循率达到 97%。
其他动态
- 开源 Agent 交互系统 OpenRoom,将 AI 互动置于可视化 Web 空间。
- M2.7 已在 MiniMax Agent 和开放平台全量上线。