开源向量数据库 Chroma 发布了 Context-1,这是一个拥有 200 亿参数的智能体搜索模型,专门用于多轮检索任务。其模型权重与合成数据生成代码均已基于 Apache 2.0 协议开源。
模型定位与核心技术
- 定位:作为检索子代理,其核心任务是通过多轮搜索为下游推理模型返回高质量的支撑文档,而非直接回答问题。
- 核心技术:采用“自编辑上下文”机制。模型能在搜索过程中主动丢弃不相关的文档片段,在有限的上下文窗口内为后续搜索腾出空间,有效避免了因上下文膨胀导致的性能退化。
训练与性能
- 训练过程:采用两阶段训练。先使用大模型生成的SFT轨迹进行监督微调,再通过基于CISPO算法的强化学习在8000多个合成任务上进一步优化。
- 奖励设计:采用课程学习机制,早期侧重召回率以鼓励广泛探索,后期逐步转向精确度以鼓励选择性保留。
- 性能表现:在Chroma自建的多个领域基准及公开基准测试中,Context-1的4路并行版本在“最终答案命中率”指标上与GPT-5.2、Opus 4.5等前沿模型持平或接近,而成本和延迟仅为后者的几分之一。
- 跨领域能力:模型仅在网页、法律和金融数据上训练,但在未训练的邮件领域也表现出显著提升,展现了其搜索能力的良好跨领域迁移性。