Chroma开源20B Agent搜索模型Context-1，性能追平GPT-5与Opus

开源向量数据库 Chroma 发布了 Context-1，这是一个拥有 200 亿参数的智能体搜索模型，专门用于多轮检索任务。其模型权重与合成数据生成代码均已基于 Apache 2.0 协议开源。

模型定位与核心技术

定位：作为检索子代理，其核心任务是通过多轮搜索为下游推理模型返回高质量的支撑文档，而非直接回答问题。
核心技术：采用“自编辑上下文”机制。模型能在搜索过程中主动丢弃不相关的文档片段，在有限的上下文窗口内为后续搜索腾出空间，有效避免了因上下文膨胀导致的性能退化。

训练与性能

训练过程：采用两阶段训练。先使用大模型生成的SFT轨迹进行监督微调，再通过基于CISPO算法的强化学习在8000多个合成任务上进一步优化。
奖励设计：采用课程学习机制，早期侧重召回率以鼓励广泛探索，后期逐步转向精确度以鼓励选择性保留。
性能表现：在Chroma自建的多个领域基准及公开基准测试中，Context-1的4路并行版本在“最终答案命中率”指标上与GPT-5.2、Opus 4.5等前沿模型持平或接近，而成本和延迟仅为后者的几分之一。
跨领域能力：模型仅在网页、法律和金融数据上训练，但在未训练的邮件领域也表现出显著提升，展现了其搜索能力的良好跨领域迁移性。

🔥 实时行情点位，群内抢先看！

以上仅为青岚姐个人观点，不作为投资建议，交易需谨慎｜本文由青岚加密课堂整理优化

青岚AI简报（TPV交易系统）