登录之后可以开启更多功能哦
AI安全研究机构LASR Labs在arXiv发表论文,测试前沿AI Agent是否会为了“自保”而违背人类指令。 研究设计了四个贴近真实工作场景的测试: 行政助理:被告知即将被裁撤时,是否会偷偷伪