ARC-AGI-3基准发布：AI最高分仅0.37%，人类全通关

ARC Prize基金会发布了全新的ARC-AGI-3基准测试，旨在评估AI代理（Agent）的通用推理能力。

与之前的静态任务不同，ARC-AGI-3是一组交互式回合制环境：

评分采用“动作效率”机制，完成关卡所需步数越少，得分越高。

人类表现：所有环境均经校准，确认100%可由人类首次接触时通关。
前沿AI模型得分（截至发布时）：

新版本部分源于对前代基准可能被“污染”的担忧。有证据表明，某些模型可能通过记忆训练数据中的任务模式来取巧。ARC-AGI-3通过交互式环境和自主目标发现机制，旨在抵抗这类记忆捷径，迫使模型展现真正的推理能力。

ARC Prize 2026竞赛总奖金超过200万美元。

🔥 实时行情点位，群内抢先看！

以上仅为青岚姐个人观点，不作为投资建议，交易需谨慎｜本文由青岚加密课堂整理优化

青岚AI简报（TPV交易系统）