新加坡管理大学、海德堡大学等机构的研究团队在arXiv发表论文,首次量化评估了仓库级配置文件AGENTS.md对AI编程Agent效率的影响。
AGENTS.md是一种存放在代码仓库根目录的指令文件,用于向AI Agent说明项目架构、构建命令和编码规范。它类似于Anthropic Claude Code的CLAUDE.md,目前已被超过6万个GitHub仓库采用。
核心实验与发现
研究团队在10个仓库的124个已合并PR上,使用OpenAI Codex进行配对实验,对比有无AGENTS.md的两种情况:
- 运行时间:中位数运行时间从98.57秒降至70.34秒,缩短约28.64%。
- 输出Token:中位数输出Token从2,925降至2,440,减少约16.58%。
- 任务完成度:任务完成行为无显著差异。
意义与局限
研究者认为,AGENTS.md将Agent指导从“短暂的提示词”转变为可版本控制、可审查的配置工件,建议开发团队将其作为标准实践。
研究局限性:仅测试了OpenAI Codex单一模型,样本限于小规模PR,未进行全面代码正确性评估。