突发Anthropic新模型公开Anthropic终于把Mythos推向公开市场不过采用分层发售。凌晨Anthropic正式发布Claude Fable 5和Claude Mythos 5。前者面向普通用户开放后者则限制在“受信任的安全合作伙伴”范围内。模型命名文学艺术概念分层新模型的命名符合Claude一贯风格。从Haiku到Sonnet再到OpusAnthropic一直用文学和艺术概念给模型分层到了Mythos名字膨胀到“神话”本身。Fable来自拉丁语fabula意思是“被讲述之物”和希腊语mythos同源直译一般称为“寓言”正如新模型定位是一个“公开的神话”。模型特点底层相同应用有别按照Anthropic描述Fable 5和Mythos 5共享同一个底层模型只是Fable 5被装进更适合公开分发的安全壳里。在官方模型能力上二者处于同一位置。但如果表现完全一样或许也不用分成两个名字。被改写的“神话”神话被改写、压缩、加上训诫后变成寓言。Fable 5是公开版本面向普通用户和开发者但在网络安全、生物、化学以及模型蒸馏等高风险领域会有额外安全分类器介入。一旦系统判断请求涉及敏感方向回答将回退到Claude Opus 4.8。Mythos 5基于同样底层模型但在部分领域解除了Fable 5的护栏。Project Glasswing里的网络安全合作伙伴可使用“满血版”Mythos 5未来部分生命科学研究者也可能通过受信任访问计划使用解除生物和化学限制的版本。定价情况价格高昂订阅需注意首先是定价Fable 5输入10美元/百万token输出50美元/百万token 开发者可通过Claude API调用claude - fable - 5。这个价格是Opus 4.8的两倍和Opus 4.8的fast mode相同Anthropic把它放在更高价格层级。不过Anthropic称这一价格不到此前Claude Mythos Preview的一半但因Mythos Preview并非公开API模型官方未给出公众标准价此说法无从验证。订阅用户要注意Fable 5不一定长期直接包含在基础订阅包里。6月23日以后即使用户已订阅ClaudeFable 5也可能根据算力情况按量提供。官方留了余地如果6月23日以后算力资源足够Anthropic会尽量把Fable 5继续包含在Pro、Max等订阅服务里。定价高可以理解但它最好保证能力配得上价格。跑分表现公开表里最强一档从跑分看Fable 5/Mythos 5基本是Anthropic目前公开表里最强的一档。不过官方表格显示Claude Fable 5和Claude Mythos 5的分数一般只差1–3个百分点除带星号的网络安全、生物相关测试表格显示的是两者更高的分数这让人想吐槽。重点方向多领域表现突出Anthropic把Fable 5的重点放在软件工程、知识工作、视觉、长上下文记忆和生命科学研究。软件工程方面Fable/Mythos 5在SWE - Bench Pro上达到80.3%高于Opus 4.8的69.2%在FrontierCode Diamond上拿到29.3%而Opus 4.8只有13.4%GPT - 5.5只有5.7%。知识工作和视觉任务上有标准化benchmark和早期客户测试两类证据。标准化benchmark方面Fable/Mythos 5在GDPval - AA上得分1932高于Opus 4.8、GPT - 5.5和Gemini 3.1 Pro在GDP.pdf带视觉理解的文档任务上达到29.8%超过其他主要模型。早期客户测试方面Fable 5在Hebbia的高级金融推理基准上取得最高分优势集中在文档推理、图表和表格理解、问题求解IMC反馈它在交易分析评估中几乎全面通过。为展示Fable 5的视觉能力Anthropic举例此前Claude模型需复杂辅助工具才能玩《宝可梦 火红》而Fable 5只靠视觉输入就可通关。长任务和记忆能力上Fable 5可在数百万token的长期任务中保持专注并利用笔记改进输出。在《杀戮尖塔》游戏里给Fable 5接入持久文件记忆其表现明显提升提升幅度是Opus 4.8的三倍到达最终关卡的次数也提高了三倍。网络安全能力方面Fable/Mythos 5在ExploitBench Cap%上达到78.0%超过Claude Mythos Preview的69.0%接近Opus 4.8的两倍这里用的应该是Mythos 5的得分因为Fable 5在高风险请求上会回退到Opus 4.8。强大的模型必须分层Anthropic把模型能力直观展示放在类似”作品集“的滑页里每个demo只给一小段注释。比如Fable 5写了太阳系模拟推导行星轨道运动并预测日食能自主玩《异星工厂》说明它可在开放环境制定策略推进复杂系统建设还做了基于浏览器的CAD编辑器用其设计3D打印完整模型编辑器内置AI copilot辅助建模完成了创造工具、使用工具、完成实体设计任务的闭环展示了流体模拟运动节奏与古典音乐EDM remix同步音乐也是Fable 5用代码生成的。这些案例表明Fable 5擅长把代码、视觉、物理、设计和长期规划混在一起做任务。后面部分说的是Mythos 5在研究者手里的作用以及Anthropic分开Fable和Mythos的原因。Anthropic称在内部蛋白设计专家评估中Mythos 5把药物设计流程部分环节加速约10倍。一个案例中Mythos 5接入蛋白设计和生物信息学工具无人类帮助可匹配甚至超过熟练人类操作员完成一整套科学工作流。在14个蛋白靶点中有9个产生强候选分子正在进一步研究。Mythos 5能稳定提出新颖、有吸引力的分子生物学假设内部科学家约80%的时候更偏好Mythos提出的假设部分已进入实验评估。Mythos 5关于大肠杆菌蛋白新机制的假设在另一家独立实验室研究中得到证实。它还完成了一项基因组学研究在一周多时间里几乎自主完成整理单细胞数据设计、训练定制机器学习模型识别不同物种中执行相同角色的细胞。训练出的模型性能超过近期发表在《Science》上的模型规模只有后者的百分之一。Anthropic计划未来几个月发表这些结果。当然这部分还需等待论文和外部复核。但从Anthropic官方信息看Mythos 5在生命科学里的能力接近科研Agent。生命科学部分是Mythos 5的能力上限展示说明Anthropic的底层模型强到必须通过受信任访问分发。过去模型发布更像技术产品的事而到了Mythos事情变复杂。同一个底层模型分为两个版本普通用户拿到Fable 5安全研究者和部分生命科学研究者拿到Mythos 5前者护栏更严格后者需受信任访问。模型能力开始有权限、场景和责任之分可看作前沿模型商业化进入新阶段的信号越强的模型越不会直接给所有人会拆成不同版本放进不同安全边界交给不同用户。Anthropic先这么做了未来其他公司或许也会效仿。大家要关注这些模型的发展谨慎选择使用避免潜在风险。