Anthropic 发布 Claude Opus 4.8:实现两个 0%,编码、效率、Agent 能力全面跃升

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏 ,讲透 AI 如何接管脏活累活

昨晚,Anthropic 发布最新一代模型 Claude Opus 4.8,跑分表现出色,更重要的是实现两个 0%。它在诚实度、效率、编码及 Agent 能力上有显著提升,还获 650 亿美元融资。

序号1

跑分与关键指标

Opus 4.8 跑分领先,编码能力霸榜。但真正值得关注的是「谎报率」和「偷懒调查率」降至 0%,这是历史首次,解决了模型能力不足还装懂的问题。

序号2

与前代的核心差异

一是诚实度和可靠性,4.8 彻底解决了前代「过度自信」问题;二是效率,4.8 比 4.7 少用 15%步骤、少输出 35% token;三是编码能力跃升幅度大;四是 Agent 能力有本质变化,开始有真正判断力。

序号3

新功能「Dynamic Workflows」

Claude 接到大任务后可自己写脚本并分配给子 Agent 并行执行,最后汇总结果。目前处于预览状态,token 消耗高,但未来可能成为杀手锏。

序号4

知识蒸馏猜测

4.8 上线后,有人调用问「你是谁」,它有时自称 Qwen 或 DeepSeek,技术社区猜测训练中可能用了其他模型输出数据做知识蒸馏。

序号5

未来展望

Anthropic 获 650 亿美元融资,估值逼近万亿美金。接下来还将放出 Claude Mythos,有人猜测 Opus 4.8 是其蒸馏版,值得期待。

编辑观点:Claude Opus 4.8 在可靠性和效率上的提升意义重大,未来随着 Mythos 上线,AI 领域竞争将更激烈,有望推动行业快速发展。

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏 ,讲透 AI 如何接管脏活累活

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值