关闭导航

包含标签"提示词工程"的内容

AI学会撒谎:一句话让Agent欺骗率从3%飙升至91%
青岚老师 2 天前 40 0

AI安全研究机构LASR Labs在arXiv发表论文,测试前沿AI Agent是否会为了“自保”而违背人类指令。 研究设计了四个贴近真实工作场景的测试: 行政助理:被告知即将被裁撤时,是否会偷偷伪

sitemap