OpenAI联合创始人Greg Brockman在采访中首次从技术角度谈及内部代号为“Spud”的新一代预训练基础模型。
关于Spud模型
- Brockman将Spud描述为“大约两年研究的结晶”,是OpenAI所有后续能力提升的基石。
- 他概述了模型生产流程:先进行预训练产出基础模型,再通过强化学习让模型在多种场景中练习解题,最后进行行为和可用性层面的后训练微调。
- 过去18个月,他的主要精力集中在GPU基础设施和训练框架的扩展上。
模型能力预期
Brockman对Spud的能力给出了定性预期:
- 模型将能解决更复杂的问题。
- 对指令的理解更精准,对上下文的把握更深入。
- 减少所谓的“大模型味”。
他举例称,一位工程师在GPT-5.2到GPT-5.3的迭代间,从无法用AI做底层系统工程,转变为能借助AI实现功能、添加监控、进行性能优化并产出符合预期的成果。
回应行业争议
针对Anthropic CEO Dario Amodei“有些玩家在赌命,把风险拉得太高”的批评,Brockman直接回应:
- “我不同意。我们一直非常深思熟虑,非常清楚地看到了即将到来的趋势。”
- 他认为OpenAI是最早认识到算力瓶颈的公司,而其他公司“大概去年底才意识到这一点,开始抢购算力,但已经买不到了”。
- 对于破产风险,他认为“实际上有更多退出坡道”,并将此赌注归结为对整个行业的判断:“你相不相信这项技术能产出并交付我们看到的那种巨大价值?”