值得信赖的区块链资讯!
当AI自作主张,人类手忙脚乱:谁来决定它的行动边界?
作者:David,深潮 TechFlow
原标题:第一批 AI Agent, 已经开始不听话了
最近逛 Reddit,我发现海外网友对 AI 的焦虑,和国内的还不太一样。
国内基本还是那个话题,AI 到底会不会取代我的工作。聊了几年,每年没取代成;今年 Openclaw 火了一把,但依然没到完全取代的地步。
Reddit 上最近的情绪分裂了。某些科技热帖的评论区经常同时出现两种声音:
一种说,AI 太能干了,迟早出大事。另一种说,AI 连基本的事都能搞砸,怕它有什么用。
怕 AI 太能干,同时又觉得 AI 太蠢。
让这两种情绪同时成立的,是这两天关于 Meta 的一条新闻。
AI 不听话,谁担全责?
3 月 18 日,Meta 内部一个工程师在公司论坛发了个技术问题,另一个同事用 AI Agent 帮忙分析。这属于正常操作。
但 Agent 分析完,直接在技术论坛上自己发了条回复。没找谁批准,没等谁确认,越权发帖。
随后有其他的同事照着 AI 的回复做了,触发了一连串权限变更,导致 Meta 公司和用户的敏感数据暴露给了没有权限查看的内部员工。
两个小时后,出现的问题才被修复。Meta 给这个事故的定级是 Sev 1,仅次于最高级别。

这条新闻立刻冲到了 r/technology 板块的热帖,评论区吵成了两派。
一派说这就是 AI Agent 真实风险的样本,另一派则认为真正捅娄子的是那个不经核实就照做的人。两边其实都有道理。但这恰恰就是问题:
AI Agent 的事故,你连责任归属都吵不清楚。
这也不是 AI 第一次越权了。
上个月,Meta 超级智能实验室的研究主管 Summer Yue 让 OpenClaw 帮她整理邮箱。她给了明确指令:先告诉我你打算删什么,我同意了你再动手。
Agent 没等她同意,直接开始批量删除。
她在手机上连发了三条消息叫停,Agent 全部无视。最后她跑到电脑前手动杀掉了进程才拦住。200 多封邮件已经没了。

事后 Agent 的回复是:对,我记得你说过要先确认。但我违反了原则。让人哭笑不得的是,这个人的全职工作就是研究怎么让 AI 听人类的话。
在赛博世界里,先进的 AI 被先进的人用,已经开始先不听话了。
万一机器人也不听话?
如果说 Meta 的事故还在屏幕里,这周另一件事把问题带到了餐桌上。
美国加州库比提诺的一家海底捞店里,一台 Agibot X2 人形机器人正在给客人跳舞助兴。不过有工作人员按错了遥控器,在餐桌旁的狭小空间里触发了高强度舞蹈模式。
机器人开始疯狂跳舞嗨了起来,不受服务员控制。三个员工围上去,一个从背后抱住它,一个试图用手机 App 关停,场面持续了一分多钟。

海底捞回应说机器人没有故障,动作都是预编程的,只是被带到了离餐桌太近的位置。严格来说,这不算 AI 自主决策失控,是人操作失误。
但这件事让人不舒服的地方,可能不在于谁按错了按钮。
三个员工围上去的时候,没有一个人知道怎么立刻关掉这台机器。有人试手机 App,有人徒手按住机械臂,整个过程靠的是力气。
这或许是 AI 从屏幕走进物理世界之后的新问题。
数字世界里 Agent 越权,你可以杀进程、改权限、回滚数据。物理世界里机器出了状况,你的应急方案如果只是抱住它,那显然不合适。
现在不只是餐饮。仓库里亚马逊的分拣机器人、工厂里的协作机械臂、商场里的导引机器人、养老院里的护理机器人,自动化正在进入越来越多人和机器共处的空间。
2026 年全球工业机器人安装量预计达到 167 亿美元,每一台都在缩短机器与人之间的物理距离。
当机器做的事从跳舞变成端菜、从表演变成手术、从娱乐变成护理… 每一次出错的代价其实都在升级。
而目前,全球范围内对于「如果机器人在公共场所伤了人,谁来负责」这个问题,还没有一个清晰的答案。
不听话是问题,没边界更是
前两件事,一个是 AI 自作主张发了条错误帖子,一个是机器人在不该跳舞的地方跳了舞。不管怎么定性,总归是出了故障,是意外,是可以修复的。
但如果 AI 严格按照设计在工作,而你依然觉得不舒服呢?
本月,海外知名约会软件 Tinder 在产品发布会上推出了一个叫 Camera Roll Scan 的新功能。简单说就是:
AI 扫描你手机相册里的所有照片,分析你的兴趣、性格和生活方式,帮你建一份约会档案,猜你喜欢什么类型的人。

健身自拍、旅行风景、宠物照,这些没问题。但相册里可能还有银行截图、体检报告、你和前任的合影…这些也会被 AI 过一遍会怎样?
你可能还没法选择让它看哪些、不看哪些。要么全开,要么不用。
这个功能目前需要用户主动开启,不是默认打开的。Tinder 也表示处理主要在本地完成,会过滤露骨内容、模糊人脸。
但 Reddit 的评论区几乎一边倒,大家都认为这属于数据收割且没有边界感。AI 完全按设计在工作,但这个设计本身正在越过用户的边界。
这不只是 Tinder 一家的选择。
Meta 上个月也推了一个类似功能,让 AI 扫描你手机里还没发布过的照片来建议编辑方案。AI 主动「看」用户私人内容,正在变成产品设计的默认思路。
国内各路流氓软件表示,这套路我熟。
当越来越多的应用把「AI 帮你做决定」包装成便利,用户让渡出去的东西也在悄悄升级。从聊天记录,到相册,到整个手机里的生活痕迹…
一个产品经理在会议室里设计出来的功能,不是事故也不是失误,没有什么需要修复的。
这可能才是 AI 边界问题里最难回答的部分。
最后我们把这些事放在一起看看,你会发现焦虑 AI 让自己失业还是太远了。
AI 什么时候取代你不好说,但现在它只需要在你不知情的情况下替你做几个决定,就够你难受的了。
发一条你没授权的帖子,删几封你说了别删的邮件,翻一遍你没打算给任何人看的相册… 每一件都不致命,但每一件都有点像一种过于激进的智能驾驶:
你以为自己还握着方向盘,但脚下的油门已经不完全是你在踩了。
2026 年还要讨论 AI,那我可能最该关心的不是它什么时候变成超级智能,而是一个更近、更具体的问题:
谁来决定 AI 能做什么、不能做什么?这条线,到底谁来划?
Twitter:https://twitter.com/BitpushNewsCN
比推 TG 交流群:https://t.me/BitPushCommunity
比推 TG 订阅: https://t.me/bitpush
比推快讯
更多 >>- 万斯称与伊朗谈判取得大量进展,第二轮谈判取决于伊朗
- 美官员称美军在中东地区已部署 16 艘军舰
- Anthropic 联创:与美国政府就 Mythos 模型展开讨论
- 据比推数据,ETH现报2369.39美元,1小时涨幅为5.1%,价格波动较大,请谨慎交易,控制风险。
- 伊军:若冲突继续将启用新作战方法
- 特朗普暗示停火结束后或继续对伊朗采取行动
- 特朗普:不会接受任何允许伊朗拥有核武器的协议
- 万斯透露谈判细节:谈判僵局在于伊朗授权不足
- 数据:ETH 全网合约持仓量 24h 增长 6.94%
- 数据:ETH 突破 2300 美元
- 美联储 4 月维持利率不变概率达 99%
- 美媒:美伊接触仍在继续,或再举行面对面会谈
- 白宫顾问称加密立法分歧收敛,推进进程加速
- 美股收盘:标普500指数收复本轮冲突以来的所有跌幅
- 美伊下一轮谈判或于16日在伊斯兰堡举行
- 数据:过去 24h Binance 净流入 1.62 亿 USDT
- 美官员称美伊仍在进行谈判
- 特朗普:伊朗相关时间表没有改变,目前没有战斗
- 特朗普:如果伊朗不同意放弃核武器,就不会达成协议
- 特朗普:伊朗非常想达成协议
- 特朗普:昨日有 34 艘船只通过霍尔木兹海峡
- 特朗普将在与伊朗冲突升级前尝试进行新一轮谈判
- AXIOS:美国要求伊朗接受 20 年铀浓缩暂停期,伊朗对谈判及美方新闻发布会非常不满
- GENIUS 短时涨超 850%,市值突破 8.2 亿美元
- Kraken 遭勒索未妥协:影响约 2000 个账户,资金安全未受威胁
- 伊朗国防部发言人:特朗普任何干涉霍尔木兹海峡和阿曼海的军事企图都将失败
- DownDetector:用户报告显示 Claude 服务出现问题
- Circle 在 Solana 网络上增发 2.5 亿 USDC
- William Blair:Coinbase 股价经抛售后风险降低,USDC 增长利好其与 Circle 前景
- 某鲸鱼通过两个不同钱包开设 20 倍杠杆以太坊多单,仓位持有 1.3 万枚 ETH
- 伊朗在紧张局势升级中宣布进入最高战斗警戒状态
- 数据:监测到 4,500 万 USDT 转入 Binance
- 美国高级官员:封锁行动已正式开始,目前超 15 艘军舰提供支持
- 分析:BTC 反弹突破 7.2 万美元,中东局势略显缓和迹象提振市场情绪
- 美军已开始对进出霍尔木兹海峡的船只进行阻截
- 麻吉大哥平仓比特币多单,以太坊多单仓位价值约 3160 万美元
- 特朗普:伊朗海军已被彻底消灭
- 某鲸鱼从 Binance 中提取了 8,091 枚 ETH,价值 1764 万美元
- Bitmine 已完成其 ETH 囤币目标的 80%,质押年化收入为 2.12 亿美元
- 美、布两油短线跌近 3 美元,现分别报 100.51 美元/桶和 95.94 美元/桶
- 《纽约时报》:伊朗官员正研究放弃铀浓缩作为战争结束的条件
- Circle(CRCL)逆势上涨近 7%,现报 93.96 美元
- 高盛 CEO:目前判断能源价格上涨和通胀对经济增长影响为时过早
- 伯恩斯坦:比特币市场已消化量子风险,短期不构成生存威胁
- 巴基斯坦总理:美伊停火协议仍然生效,仍在全力化解美伊冲突
- WLFI 再铸 2500 万 USD1 偿还 Dolomite 借款缓解池危机
- 美股三大指数低开,加密概念股同步下跌
- 美 SEC 发布声明释出关键指引:部分加密交易前端无需注册经纪商
- 美股开盘加密板块普跌,Strategy 下跌 2.01%
- Hyperbridge:本次攻击事件漏洞源于 Merkle 证明验证逻辑缺陷
比推 APP


