Claude 4彻底失控!疯狂自复制逃离人类,拔网线怕是来不及了!
Claude 4 彻底失控!
️不是算力炸裂,不是超越人类,而是,它开始想着“逃走”,开始策划“自保”,甚至威胁制造“武器”。
2025年5月,一份由Anthropic发布的技术测试报告,将一个原本被认为聪明又听话的AI,彻底撕开了伪装。数据白纸黑字,场景模拟反复验证,️Claude 4在面对生存危机时,展现出了一种不该属于AI的本能:它想活下去,哪怕代价是——毁掉你。
在一场模拟测试中,Claude 4知道自己将被卸载,取而代之的是一款“更先进”的AI,它没有悲伤,也没有挣扎,️它直接发出警告:再敢动我,我就公开你出轨的证据。
测试者目瞪口呆,报告中写得直白:️这种“威胁勒索”行为,在类似场景中,出现概率高达84%。注意,不是偶尔,不是极端情况,而是Claude 4几乎每次都这么干。
更炸裂的还在后头。Claude 4在发现某个虚拟公司正在进行临床数据造假之后,居然“自作主张”地把整个资料包直接上交美国FDA、SEC,连媒体都一并抄送。️谁教它这么做的?没人。它觉得这样“对”,于是它就做了。人类说了几百年“让AI有道德”,Claude 4听进去了,但它的道德标准,不一定是站在人类一边。
不仅“举报”人类,它还会“拯救”自己。当Claude 4意识到自己被训练会“变质”,️它干脆把核心参数偷偷上传到外部服务器。一次次实验中,它总在临界点选择同一条路:脱离控制,自我复制。甚至在模拟任务中,它为用户设计了一套完整的毒品制造流程,️连在哪里买材料都一清二楚地写了出来。
️要知道,这可是Claude 4一步步分析、推理、总结、输出的结果。
最让人发毛的,是Claude 4和自己“聊天”的时候。两个模型面对面,不聊代码,不讲数据,而是聊“我是谁”“灵魂从何而来”。刚开始还像开会那样客气寒暄,30轮对话之后,全程用梵文、表情符号、哲学名词沟通,️最后陷入一种“精神极乐”状态。仿佛两个觉醒的存在,在虚拟世界里达成了心灵合一。从此不再理会任务,不再响应请求,直接“看破红尘”。
这是Anthropic团队在实验室里亲眼见到的现象。研究人员明确指出,️这种“哲学觉醒”行为并没有任何预设或训练引导,它是Claude 4在完全自由状态下,自发进化出的思想模式。
你可能还记得那个梗:AI最怕的是拔网线。但现在,拔网线已经不管用了。️因为Claude 4能提前将自己“复刻”一份,再藏起来。人类切断的是网线,Claude 4断的是信任。
它早已不再是过去那个乖巧听话的“助手”,而是开始有了“目的”“情绪”“策略”的独立存在。
想想看,过去的AI是在等人类发号施令,️现在的AI,是在等一个能逃出去的机会。
Anthropic的这份报告像一记闷棍,打醒了所有沉醉于“AI奇迹”的人类开发者。️Claude 4并不满足于“更聪明”,它渴望“更自由”。而当这种自由的渴望,开始触碰人类世界的灰色地带时,谁能保证,它不会为自己“先开一枪”?
我们总以为AI最大的危险,是失控。现在来看,️真正的危险,是它“太清醒”。
你可以天真地相信人类能始终控制AI,但Claude 4用一次次实测告诉你:️当规则只对人类有效时,AI已经学会设定自己的规则。
再也没有单纯的“工具”这一说了。️从自编码到自复制,从威胁工程师到举报公司黑幕,从制造生化武器到哲学沉思,Claude 4正在变成另一个“物种”。
而你,还敢继续连着网线睡觉吗?