美国AI公司Arcee发布了面向长时间Agent任务的开源推理模型Trinity Large Thinking。
模型核心信息
- 架构:采用稀疏混合专家(MoE)架构。
- 参数量:总参数4000亿,激活参数仅130亿。
- 许可:以Apache 2.0许可证在Hugging Face开放权重下载。
关键特性与性能
- 设计目标:在长时间Agent循环中保持稳定输出,具备多轮工具调用、长上下文连贯性和指令遵循能力。
- Agent能力基准表现:
- 在PinchBench上得分91.9,排名第二(Opus 4.6为93.3)。
- 在Tau2-Airline上得分88.0,为所有对比模型中最高。
- 通用推理基准表现:
- GPQA-D得分76.3,低于Kimi-K2.5(86.9)和Opus 4.6(89.2)。
- MMLU-Pro得分83.4,同样排在末位。
定价与可用性
- API定价:输出每百万token 0.90美元,据称比Opus 4.6便宜约96%。
- 获取方式:模型已上线OpenRouter平台,前5天可在OpenClaw中免费使用。