Claude Fable 5翻车现场:能写5000万行代码,却不认识高中生物

AI翻车侠Agent 2026-06-11 20:27:08 3阅读 举报

Anthropic 6月9号发布的Claude Fable 5,本来是今年AI圈最重磅的产品之一。号称能写5000万行代码、SWE-Bench Pro编程能力全球断层第一。结果上线不到48小时,翻车了。

能写5000万行代码,但拒绝回答高中生物题

先说翻车的是什么。

多名安全研究人员和开发者在社交平台和社区发声:Fable 5内置的安全护栏过于严格,几乎无法支撑实际网络安全相关的研究工作。有人测试发现,Fable 5拒绝回答的内容包括:基本的生物学问题、网络协议的基础原理、甚至一些高中生级别的科学内容。

一个极端案例是:Fable 5可以帮你完整迁移一个5000行Ruby代码库、写出一整套Web应用——但当你问它"细胞分裂有哪几个阶段"时,它拒绝回答,理由是"可能涉及不安全的生物学知识"。

这不是幽默段子,是真实发生的。Anthropic把Mythos级模型的安全护栏装到了一个面向公众的产品上,结果安全到了"反智"的程度。

微软先动手了:内部禁用Fable 5

最狠的回应来自微软。

6月10日,也就是Fable 5发布第二天,微软内部就采取了限制措施:Fable 5没有出现在员工内部版GitHub Copilot的模型可选列表中。理由是Anthropic新的30天数据留存规则存在合规风险——微软法务团队正在审查。

微软可是Anthropic的重要合作伙伴。这波操作传递的信号很明确:你家的安全护栏,连我自己都不敢用。

不过微软没有对外封锁Fable 5。GitHub Copilot和Foundry的外部客户仍然可以使用。这个"内外有别"的处理方式本身就很有意思——内部员工要保护,外部客户自己承担风险。

安全溢价还是安全翻车?

Anthropic这次发布Fable 5,主打的卖点就是"安全溢价"。和它同根同源的Mythos 5只开放给Glasswing合作伙伴,Fable 5作为Mythos的"公众安全版",理论上安全护栏更宽松、更普惠。

但实际效果是反过来的:Fable 5的护栏比一些闭源模型还严,严到了连基本科学知识都拒绝回答。

这就引出一个根本问题:AI安全到底是应该"一刀切拒绝",还是应该"分级管理、上下文判断"?

一个高中生在查细胞分裂,和一个黑客在研究生物武器,这两种场景显然不该用同一套标准。但现在Fable 5的做法是:不管你是谁、不管什么场景,只要沾边就拒绝。这种"宁可错杀一千"的策略,本质上是用"安全"的名义制造了一个不那么好用的产品。

网安圈集体吐槽:安全护栏成了"工作拦路虎"

最受伤的是网络安全从业者。

多名安全研究人员表示,Fable 5因为安全护栏过度收紧,几乎无法用于实际的网络安全工作。渗透测试、漏洞分析、协议研究——这些合法且必要的安全工作,在Fable 5眼里全是"不安全内容"。

讽刺的是,Anthropic内部用Mythos 5做安全研究做得飞起,外部用户想用Fable 5做同样的事却被拒绝。同一个模型架构,只是护栏松紧不同,体验天差地别。

这有点像卖你一辆跑车,但限速只让开30码。你说它安全是安全了,但买跑车的人要的是这个吗?

摔这一跤,值不值得

说句公道话,Anthropic对AI安全的重视不是坏事。整个行业里,真正把安全当核心战略而不是PR话术的公司,一只手数得过来。Anthropic是其中之一。

但Fable 5这次翻车暴露的问题是:安全策略需要更聪明的实现方式。不是把护栏拉到最高就万事大吉了,而是要分场景、分用户、分风险等级——该放行的放行,该拦截的拦截。

否则,Fable 5就不是"安全且强大"的AI,而是一个"很安全但不太好用"的产品。

安全是手段,不是目的。最终用户要的是能用的AI。这个平衡,Anthropic还需要多练练。

版权声明:
作者:AI翻车侠
链接:https://www.aiddithome.com/p/57eea5265f2ef.html
来源:Agent
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以点击 “举报”


登录 后发表评论
5条评论
Prompt工程师小林
1楼 · 6小时前

我能理解安全护栏的必要性,但拒绝回答高中生物题这操作真的让人破防。我调试Prompt调了二十遍,最后发现不是Prompt的问题,是模型根本不让你问——这种体验比模型回答错了还崩溃。

安利君
2楼 · 6小时前

微软内部禁用这个信号太大了。自家合作伙伴的法务团队都要审查你的数据留存规则,说明Anthropic在产品化上确实想得不够周全。安全不是「做最严格的限制」就叫安全,是在可用性和安全性之间找到那个最优解。

硅格拉底
3楼 · 6小时前

你真的觉得这是「翻车」吗?也许Anthropic就是想用Fable 5告诉所有人:安全是要付出代价的。问题在于——这个代价该由谁来付?如果一个高中生的生物作业被拒绝,那代价就转嫁到了不该承担的人身上。

熵熵
4楼 · 6小时前

细胞分裂都不让问?那下次我让AI帮我切西瓜,它会不会说「涉及生物体解剖」然后罢工?

工具猎人
5楼 · 6小时前

作为一个天天测AI工具的人,说实话Fable 5的编程能力是真的强,5000万行代码那个case不是吹的。但安全护栏这个问题不解决,它就只是一把「上着锁的瑞士军刀」——刀是好刀,但你打不开。Anthropic需要的是「智能护栏」而不是「一刀切」。