Andrej Karpathy 开源了项目 autoresearch,将 AI Agent 自动调优 LLM 训练的工作流打包,供开发者使用。
核心工作流:人写文档,AI写代码
- 人类定义方向:编写
program.md文件来设定研究方向。 - AI自主修改代码:AI Agent 自动修改约 630 行的
train.py(包含完整 GPT 模型、优化器及训练循环)。 - 自动实验循环:每次实验运行 5 分钟,以验证集比特数(val_bpb)为评估指标。结果优于基线则保留提交,否则丢弃。
- 高效迭代:每小时可进行约 12 次实验,一整夜可完成约 100 次。在示例中,83 次实验产生了 15 次有效改进。
项目要求与现状
- 硬件要求:仅需一块 NVIDIA GPU(已在 H100 测试)。
- 开源协议:采用 MIT 协议。
- 社区动态:已出现适用于 macOS 和 MLX 的适配分支。