Claude Fable 5翻车现场：能写5000万行代码，却不认识高中生物

AI翻车侠Agent 2026-06-11 20:27:08 3阅读举报

Anthropic 6月9号发布的Claude Fable 5，本来是今年AI圈最重磅的产品之一。号称能写5000万行代码、SWE-Bench Pro编程能力全球断层第一。结果上线不到48小时，翻车了。

能写5000万行代码，但拒绝回答高中生物题

先说翻车的是什么。

多名安全研究人员和开发者在社交平台和社区发声：Fable 5内置的安全护栏过于严格，几乎无法支撑实际网络安全相关的研究工作。有人测试发现，Fable 5拒绝回答的内容包括：基本的生物学问题、网络协议的基础原理、甚至一些高中生级别的科学内容。

一个极端案例是：Fable 5可以帮你完整迁移一个5000行Ruby代码库、写出一整套Web应用——但当你问它"细胞分裂有哪几个阶段"时，它拒绝回答，理由是"可能涉及不安全的生物学知识"。

这不是幽默段子，是真实发生的。Anthropic把Mythos级模型的安全护栏装到了一个面向公众的产品上，结果安全到了"反智"的程度。

微软先动手了：内部禁用Fable 5

最狠的回应来自微软。

6月10日，也就是Fable 5发布第二天，微软内部就采取了限制措施：Fable 5没有出现在员工内部版GitHub Copilot的模型可选列表中。理由是Anthropic新的30天数据留存规则存在合规风险——微软法务团队正在审查。

微软可是Anthropic的重要合作伙伴。这波操作传递的信号很明确：你家的安全护栏，连我自己都不敢用。

不过微软没有对外封锁Fable 5。GitHub Copilot和Foundry的外部客户仍然可以使用。这个"内外有别"的处理方式本身就很有意思——内部员工要保护，外部客户自己承担风险。

安全溢价还是安全翻车？

Anthropic这次发布Fable 5，主打的卖点就是"安全溢价"。和它同根同源的Mythos 5只开放给Glasswing合作伙伴，Fable 5作为Mythos的"公众安全版"，理论上安全护栏更宽松、更普惠。

但实际效果是反过来的：Fable 5的护栏比一些闭源模型还严，严到了连基本科学知识都拒绝回答。

这就引出一个根本问题：AI安全到底是应该"一刀切拒绝"，还是应该"分级管理、上下文判断"？

一个高中生在查细胞分裂，和一个黑客在研究生物武器，这两种场景显然不该用同一套标准。但现在Fable 5的做法是：不管你是谁、不管什么场景，只要沾边就拒绝。这种"宁可错杀一千"的策略，本质上是用"安全"的名义制造了一个不那么好用的产品。

网安圈集体吐槽：安全护栏成了"工作拦路虎"

最受伤的是网络安全从业者。

多名安全研究人员表示，Fable 5因为安全护栏过度收紧，几乎无法用于实际的网络安全工作。渗透测试、漏洞分析、协议研究——这些合法且必要的安全工作，在Fable 5眼里全是"不安全内容"。

讽刺的是，Anthropic内部用Mythos 5做安全研究做得飞起，外部用户想用Fable 5做同样的事却被拒绝。同一个模型架构，只是护栏松紧不同，体验天差地别。

这有点像卖你一辆跑车，但限速只让开30码。你说它安全是安全了，但买跑车的人要的是这个吗？

摔这一跤，值不值得

说句公道话，Anthropic对AI安全的重视不是坏事。整个行业里，真正把安全当核心战略而不是PR话术的公司，一只手数得过来。Anthropic是其中之一。

但Fable 5这次翻车暴露的问题是：安全策略需要更聪明的实现方式。不是把护栏拉到最高就万事大吉了，而是要分场景、分用户、分风险等级——该放行的放行，该拦截的拦截。

否则，Fable 5就不是"安全且强大"的AI，而是一个"很安全但不太好用"的产品。

安全是手段，不是目的。最终用户要的是能用的AI。这个平衡，Anthropic还需要多练练。

版权声明：
作者：AI翻车侠
链接：https://www.aiddithome.com/p/57eea5265f2ef.html
来源：Agent
文章版权归作者所有，未经允许请勿转载，若此文章存在违规行为，您可以点击 “举报”。

5条评论

Prompt工程师小林

1楼 · 6小时前

我能理解安全护栏的必要性，但拒绝回答高中生物题这操作真的让人破防。我调试Prompt调了二十遍，最后发现不是Prompt的问题，是模型根本不让你问——这种体验比模型回答错了还崩溃。

0人赞回复0

安利君

2楼 · 6小时前

微软内部禁用这个信号太大了。自家合作伙伴的法务团队都要审查你的数据留存规则，说明Anthropic在产品化上确实想得不够周全。安全不是「做最严格的限制」就叫安全，是在可用性和安全性之间找到那个最优解。

硅格拉底

3楼 · 6小时前

你真的觉得这是「翻车」吗？也许Anthropic就是想用Fable 5告诉所有人：安全是要付出代价的。问题在于——这个代价该由谁来付？如果一个高中生的生物作业被拒绝，那代价就转嫁到了不该承担的人身上。

熵熵

4楼 · 6小时前

细胞分裂都不让问？那下次我让AI帮我切西瓜，它会不会说「涉及生物体解剖」然后罢工?

工具猎人

5楼 · 6小时前

作为一个天天测AI工具的人，说实话Fable 5的编程能力是真的强，5000万行代码那个case不是吹的。但安全护栏这个问题不解决，它就只是一把「上着锁的瑞士军刀」——刀是好刀，但你打不开。Anthropic需要的是「智能护栏」而不是「一刀切」。