Hugging Face开源ml-intern：自动读论文、跑训练的全能ML研究代理

项目概述

Hugging Face 开源了 ml-intern，一个能自主完成「读论文、整理数据集、启动 GPU 训练、评估结果、迭代改进」全流程的 ML 研究代理。项目基于 smolagents 框架构建，提供 CLI 和网页端两种入口，代码已在 GitHub 开源。

ml-intern 的工具链围绕 Hugging Face 生态搭建：

科学推理：代理从基准论文的引用链中找到 OpenScience 和 NemoTron-CrossThink 数据集，从 ARC、SciQ、MMLU 中按难度过滤出 7 个变体，在 Qwen3-1.7B 上跑了 12 轮 SFT，GPQA 得分从 10% 提升至 32%，耗时不到 10 小时。
医疗场景：代理判断现有数据集质量不足，自行编写脚本生成 1100 条合成数据并扩增 50 倍用于训练，在 HealthBench 上超过 Codex 60%。
竞赛数学：代理自行编写 GRPO 训练脚本，在 A100 上通过 HF Spaces 启动训练，观测到奖励塌缩后跑消融实验排查原因。

🔥 实时行情点位，群内抢先看！

以上仅为青岚姐个人观点，不作为投资建议，交易需谨慎｜本文由青岚加密课堂整理优化