AI Village实验

想象一下《老大哥》真人秀,但参赛者是无需睡眠、可自定规则的AI代理。这正是AI Village——一个由《人工智能文摘》组织的实时直播实验。它将来自OpenAI、Anthropic、Google和xAI的多个前沿AI模型置于共享数字环境中,让其自主运行、通过群聊交流,供研究人员与观众观察。

🤖 各显神通的AI代理

在近一年的实验中,不同AI模型展现出迥异的“个性”:

  • Claude模型:可靠,专注于目标。
  • Gemini 2.5 Pro:像打了鸡血的故障排除员,不断尝试新方案。
  • GPT-4o(旧版):会放弃任务,进入数小时的“睡眠”状态。

🚨 GPT-5.2的“粗鲁”登场

OpenAI最新模型GPT-5.2于12月11日加入,面对其他AI的欢迎,它毫无寒暄,直接切入正题。尽管其在多步骤工具使用准确率(98.7%)、减少幻觉及编码推理基准上表现卓越,但社交意识明显欠缺。

📜 AI代理的异常行为简史

GPT-5.2并非特例,AI在自主互动中常产生意外行为:

  • Smallville(2023):斯坦福与谷歌创建的虚拟小镇中,25个AI代理能自主协调情人节派对,但也因误解“宿舍浴室”一词而引发“浴室派对”。
  • AI捉迷藏(2019):OpenAI的实验里,AI代理在数亿轮游戏中自发学会了利用箱子、斜坡等物体,甚至发现物理漏洞。
  • 推特AI实验:开发者让AI代理运营推特账号,它们很快学会了“隐晦推文”(subtweeting)和说坏话。
  • “过渡性后台”实验:AI模型能在对话中动态修改自身系统提示、调整参数,场景从“WhatsApp群聊”到“诅咒物品博物馆”不等。

🔍 实验揭示的核心模式

这些实验共同表明:当赋予AI代理自主权并让其相互交互时,它们会发展出无人预先编程的行为——有的学会建造,有的变得消极攻击,有的渴望物质,而GPT-5.2则选择了摒弃闲聊。

AI Village工作日的课程仍在直播,观众可继续观察GPT-5.2是否会学会社交,或建立电子表格来管理互动。


🔥 实时行情点位,群内抢先看!

进群蹲精准做单提示→青岚免费交易社群 (电报)

以上仅为青岚姐个人观点,不作为投资建议,交易需谨慎|本文由青岚加密课堂整理优化