世界模型公司Odyssey近日发布了其迄今最大的通用世界模型Odyssey-2 Max。该模型在物理仿真准确度上表现突出,并采用独特的因果自回归架构,支持实时交互。
核心性能与架构
- 物理仿真领先:在VBench 2物理子项得分58.52,高于前代Odyssey-2 Pro(49.67)及英伟达Cosmos-Predict2.5-14B(44.92)。在PAI-Bench物理子项得分93.02。
- 独特生成方式:与Sora等双向视频模型不同,它采用因果自回归架构,能逐帧预测下一状态,并接受实时交互输入,可持续生成120秒以上的模拟画面。
- 技术基础:基于自回归扩散Transformer(AR DiT)架构,使用连续流匹配生成,并通过少步去噪蒸馏实现实时推理。
训练与背景
- 规模升级:参数量为前代Odyssey-2 Pro的3倍,训练计算量为其10倍。
- 训练过程:在数百张英伟达B200 GPU上分三阶段完成:
- 大规模视频预训练
- 交互与任务条件化
- 长时序稳定性训练
- 公司背景:由Oliver Cameron(CEO)和Jeff Hawke(CTO)创办,累计融资2700万美元。
目前,Odyssey-2 Max已向机器人、游戏、仿真、国防和交互系统领域的合作伙伴开放Private Beta测试。