Andrej Karpathy 开源了项目 autoresearch,将 AI Agent 自动调优 LLM 训练的工作流打包,供开发者使用。

核心工作流:人写文档,AI写代码

  • 人类定义方向:编写 program.md 文件来设定研究方向。
  • AI自主修改代码:AI Agent 自动修改约 630 行的 train.py(包含完整 GPT 模型、优化器及训练循环)。
  • 自动实验循环:每次实验运行 5 分钟,以验证集比特数(val_bpb)为评估指标。结果优于基线则保留提交,否则丢弃。
  • 高效迭代:每小时可进行约 12 次实验,一整夜可完成约 100 次。在示例中,83 次实验产生了 15 次有效改进。

项目要求与现状

  • 硬件要求:仅需一块 NVIDIA GPU(已在 H100 测试)。
  • 开源协议:采用 MIT 协议。
  • 社区动态:已出现适用于 macOS 和 MLX 的适配分支。

🔥 实时行情点位,群内抢先看!

进群蹲精准做单提示→青岚免费交易社群 (电报)

以上仅为青岚姐个人观点,不作为投资建议,交易需谨慎|本文由青岚加密课堂整理优化