英国AI安全研究所发布了针对Claude Mythos Preview的网络安全能力评测。

  • 专家级CTF任务表现:在2025年4月前无任何模型能完成的高难度任务上,Mythos Preview的成功率达到73%。
  • 企业网络攻击模拟:在名为“The Last Ones”的32步完整攻击链模拟中,Mythos Preview成为首个全程通关的模型。在10次测试中,它3次完整完成,平均完成22步。作为对比,Claude Opus 4.6平均完成16步。
  • 测试条件说明:该测试在受控环境下进行,模型获得了明确引导和网络访问权限。测试环境与真实网络存在关键差异:没有主动防守方和防御工具,触发警报也无惩罚。因此,其结果不能直接等同于能攻破防护严密的真实系统。
  • 安全评估的挑战:AISI指出,AI模型从两年前几乎无法完成初级任务,发展到如今能应对复杂模拟,其进步速度要求安全评估方法必须快速升级。未来测试将纳入主动防守和实时响应机制。

🔥 实时行情点位,群内抢先看!

进群蹲精准做单提示→青岚免费交易社群 (电报)

以上仅为青岚姐个人观点,不作为投资建议,交易需谨慎|本文由青岚加密课堂整理优化