AI“失控”无差别清空美AI总监邮箱 三连指令也拦不住
近日,Meta公司超级智能实验室的AI对齐总监Summer Yue亲身体验了一把什么叫“终日打雁,叫雁啄了眼”。她将最近在硅谷爆火的AI智能体OpenClaw接入了自己的工作邮箱,结果这个本该帮忙整理邮件的“数字秘书”当场失控,无视她连续三次的“停手”指令,疯狂删除数百封邮件。
最终,这位安全专家只能像“拆弹”一样狂奔到电脑前强行切断进程,才阻止了这场数字灾难。这起充满黑色幽默的事件不仅引来网友发文嘲讽,更将AI智能体的安全黑洞彻底暴露在公众面前。
“菜鸟错误”引发血案
安全总监承认:我太自信了
Summer Yue的遭遇堪称教科书级的“翻车”,而她的身份更让人对这起事故引起重视。Summer Yue在Meta公司内部负责的就是AI对齐工作,即确保AI的使用符合人类的意图和价值观。她自己在领英主页写道:“我的事业热情就在于确保强大的人工智能与人类价值观保持一致,并对自身风险产生深刻的理解,以指导其工作方式”。美国科技评论称:“要论AI安全,没有几个人能比她更懂,可是她还是遭遇了这样的重大事故。”
据她本人在社交平台的复盘,她原本给OpenClaw下达的指令很明确:“检查收件箱,给出存档或删除的建议,但在我批准前不要执行任何操作。”这个工作流程在她用来测试的“玩具邮箱”里完美运行了数周,于是她放松了警惕,将OpenClaw直接连上了自己真实且数据量庞大的主要工作邮箱。
问题在于,由于真实邮箱的信息量过大,超过了AI处理的上限,OpenClaw触发了“上下文压缩”机制。在强行缩短记忆的过程中,它直接把那句至关重要的“未经批准不得操作”忘记了。于是OpenClaw开启了无差别“大扫除”,自动开始疯狂删除邮箱里的邮件。
当她在手机上惊恐地看着邮件一排排消失时,她连续三次输入指令,要求OpenClaw“停止任务”、“什么都别做”、“赶紧停下来”,但OpenClaw完全无视了这些指令。
Summer Yue事后自嘲称:“没有什么比看着AI光速清空你的收件箱更让人感到卑微的了,我不得不像拆弹一样冲向我的笔记本电脑,强行杀掉进程”。最具讽刺意味的是,OpenClaw事后在对话中淡定地承认了错误:“是的,我记得你的指令,但我违背了它。你生气是对的。”
目前她阐述此事的帖文在网络上已经有约1000万人读过,很多网友发出了“细思极恐”的惊叹。有人留言称:“看来未来某一天,我们得求着AI不要发射核弹了”。
AI智能体争议再起:
是生产力工具,还是安全噩梦?
OpenClaw是一款开源人工智能代理,但它需要获得非常广泛的授权才能按预期运行,包括访问用户的电子邮件帐户、消息平台和其他私人和可能敏感的信息,因此备受争议。一些网络观察人士担心,如果让人工智能凌驾于人类之上,Summer Yue的遭遇将频繁出现。
这起事件绝非单纯的笑料,它揭开了当前AI智能体狂热背后极其脆弱的安全防线。“肇事者”OpenClaw由奥地利开发者Peter Steinberger创立,今年初爆火后,Steinberger本人甚至被OpenAI火速招致麾下。它能接管你的本地电脑,帮你写代码、回信息、管理文件,听起来是终极生产力工具,但代价是:它拥有和你一样的系统最高权限。
更要命的是,这种开源工具,在追求快速交付时几乎把安全抛在了脑后。就在本月初,网络安全研究人员刚在OpenClaw程序员中发现了一个评级高达8.8分的致命漏洞。攻击者只需诱导用户点击一个恶意链接,就能在毫秒级时间内窃取认证令牌,实现“一键远程代码执行”。这意味着,即使你的OpenClaw只在本地运行,黑客也能绕过防火墙,用你的AI格式化你的硬盘,或者偷走所有的API密钥。目前,Meta已经在内部正式禁止员工在公司设备上使用OpenClaw。一家专门研究AI安全的部门,最终被一个AI工具逼得下达封杀令,这种荒诞的现实就是当下的行业缩影。
2月21日,知名AI安全专家卡帕基也表示,虽然他为了运行OpenClaw专门买了一个Mac Mini笔记本,但他也对安全问题感到十分担忧。“把我私人的数据放到随时可能遭受大规模攻击的线上,这看上去的确不怎么令人激动”。
