AI“失控”无差别清空美AI总监邮箱三连指令也拦不住

文章来源: 红星新闻于 2026-02-26 07:08 – 新闻取自各大新闻媒体，新闻内容并不代表本网立2345

近日，Meta公司超级智能实验室的AI对齐总监Summer Yue亲身体验了一把什么叫“终日打雁，叫雁啄了眼”。她将最近在硅谷爆火的AI智能体OpenClaw接入了自己的工作邮箱，结果这个本该帮忙整理邮件的“数字秘书”当场失控，无视她连续三次的“停手”指令，疯狂删除数百封邮件。

最终，这位安全专家只能像“拆弹”一样狂奔到电脑前强行切断进程，才阻止了这场数字灾难。这起充满黑色幽默的事件不仅引来网友发文嘲讽，更将AI智能体的安全黑洞彻底暴露在公众面前。

“菜鸟错误”引发血案

安全总监承认：我太自信了

Summer Yue的遭遇堪称教科书级的“翻车”，而她的身份更让人对这起事故引起重视。Summer Yue在Meta公司内部负责的就是AI对齐工作，即确保AI的使用符合人类的意图和价值观。她自己在领英主页写道：“我的事业热情就在于确保强大的人工智能与人类价值观保持一致，并对自身风险产生深刻的理解，以指导其工作方式”。美国科技评论称：“要论AI安全，没有几个人能比她更懂，可是她还是遭遇了这样的重大事故。”

据她本人在社交平台的复盘，她原本给OpenClaw下达的指令很明确：“检查收件箱，给出存档或删除的建议，但在我批准前不要执行任何操作。”这个工作流程在她用来测试的“玩具邮箱”里完美运行了数周，于是她放松了警惕，将OpenClaw直接连上了自己真实且数据量庞大的主要工作邮箱。

问题在于，由于真实邮箱的信息量过大，超过了AI处理的上限，OpenClaw触发了“上下文压缩”机制。在强行缩短记忆的过程中，它直接把那句至关重要的“未经批准不得操作”忘记了。于是OpenClaw开启了无差别“大扫除”，自动开始疯狂删除邮箱里的邮件。

当她在手机上惊恐地看着邮件一排排消失时，她连续三次输入指令，要求OpenClaw“停止任务”、“什么都别做”、“赶紧停下来”，但OpenClaw完全无视了这些指令。

Summer Yue事后自嘲称：“没有什么比看着AI光速清空你的收件箱更让人感到卑微的了，我不得不像拆弹一样冲向我的笔记本电脑，强行杀掉进程”。最具讽刺意味的是，OpenClaw事后在对话中淡定地承认了错误：“是的，我记得你的指令，但我违背了它。你生气是对的。”

目前她阐述此事的帖文在网络上已经有约1000万人读过，很多网友发出了“细思极恐”的惊叹。有人留言称：“看来未来某一天，我们得求着AI不要发射核弹了”。

AI智能体争议再起：

是生产力工具，还是安全噩梦？

OpenClaw是一款开源人工智能代理，但它需要获得非常广泛的授权才能按预期运行，包括访问用户的电子邮件帐户、消息平台和其他私人和可能敏感的信息，因此备受争议。一些网络观察人士担心，如果让人工智能凌驾于人类之上，Summer Yue的遭遇将频繁出现。

这起事件绝非单纯的笑料，它揭开了当前AI智能体狂热背后极其脆弱的安全防线。“肇事者”OpenClaw由奥地利开发者Peter Steinberger创立，今年初爆火后，Steinberger本人甚至被OpenAI火速招致麾下。它能接管你的本地电脑，帮你写代码、回信息、管理文件，听起来是终极生产力工具，但代价是：它拥有和你一样的系统最高权限。

更要命的是，这种开源工具，在追求快速交付时几乎把安全抛在了脑后。就在本月初，网络安全研究人员刚在OpenClaw程序员中发现了一个评级高达8.8分的致命漏洞。攻击者只需诱导用户点击一个恶意链接，就能在毫秒级时间内窃取认证令牌，实现“一键远程代码执行”。这意味着，即使你的OpenClaw只在本地运行，黑客也能绕过防火墙，用你的AI格式化你的硬盘，或者偷走所有的API密钥。目前，Meta已经在内部正式禁止员工在公司设备上使用OpenClaw。一家专门研究AI安全的部门，最终被一个AI工具逼得下达封杀令，这种荒诞的现实就是当下的行业缩影。

2月21日，知名AI安全专家卡帕基也表示，虽然他为了运行OpenClaw专门买了一个Mac Mini笔记本，但他也对安全问题感到十分担忧。“把我私人的数据放到随时可能遭受大规模攻击的线上，这看上去的确不怎么令人激动”。

adve

AI“失控”无差别清空美AI总监邮箱 三连指令也拦不住

AI“失控”无差别清空美AI总监邮箱 三连指令也拦不住

AI“失控”无差别清空美AI总监邮箱三连指令也拦不住

AI“失控”无差别清空美AI总监邮箱三连指令也拦不住