💡 今日趋势速览:Anthropic发布Claude Sonnet 5,强化自主规划与工具使用;Google DeepMind推出低成本图像模型Nano Banana 2 Lite;Anthropic Fable 5获准全球重新上线。
🎯 今日要点
- Anthropic 推出 Claude Sonnet 5,提升代理能力
- Google DeepMind 发布 Nano Banana 2 Lite 与 Omni Flash
- Anthropic Fable 5获准全球重新上线
📋 今日内容汇总
🤖 AI动态
- Anthropic 推出 Claude Sonnet 5,提升代理能力
- Google DeepMind 发布 Nano Banana 2 Lite 与 Omni Flash
- Anthropic Fable 5获准全球重新上线
- Claude Sonnet 5被曝准备登陆OpenRouter
- Anthropic 推出 Claude Science 科研工作台
- Claude Code 被发现对请求做隐写式标记
- Claude Desktop 推出 Linux 公测版
- OpenAI 工程师开发推理优化使成本减半
- x402 将智能体可购工具规模扩大十倍
- Google 更新 Gemini Spark 并推出 macOS 版
- OpenAI 发布 GeneBench-Pro 生物基准
- Anthropic 身份验证准备信息曝光
🔌 AI基础设施
🧪 芯片半导体
📌 模型排行榜
🤖 AI动态
1. Anthropic 推出 Claude Sonnet 5,提升代理能力
今日 Anthropic 的新闻比较多,首先是 Claude Sonnet 5 模型发布,其具备更强的自主规划与工具使用能力,可操作浏览器和终端。该模型在推理、编码和知识工作方面显著超越 Sonnet 4.6,性能接近 Opus 4.8 但价格更低,标志着 AI 代理能力的重要进步。



2. Google DeepMind 发布 Nano Banana 2 Lite 与 Omni Flash
Google DeepMind 推出图像模型 Nano Banana 2 Lite,为该系列速度最快、成本最低,文本到图像仅需 4 秒、每千分辨率成本 0.034 美元此外, 同步推出 Gemini Omni Flash支持高画质视频生成与对话式编辑,视频定价 0.1 美元每秒。以下是官方给出的 demo 视频,使用 Omni Flash 制作的魔术表演。



爆料称,Anthropic 已获准在正式解除限制后全球重新上线 Fable 5,发布时间可能等团队恢复办公后推进。该消息显示围绕 Anthropic 新模型的监管与发布节奏仍在快速变化,包括可用地区仍需等待官方确认。

4. Claude Sonnet 5被曝准备登陆OpenRouter
TestingCatalog 发现 Claude Sonnet 5 正以 20260630 代号准备登陆 OpenRouter,暗示 Anthropic 新模型可能进入第三方聚合平台。该线索尚未等同正式发布,但反映模型分发渠道和上线节奏值得跟踪,需要继续观察官方和平台页面变化。


5. Anthropic 推出 Claude Science 科研工作台
Anthropic 推出 AI 科研工作台 Claude Science,整合常用工具与计算资源,支持从文献分析到多步骤研究的全流程。它提供超 60 项预配置技能,覆盖基因组学、蛋白质组学等领域,可在本地或通过 SSH 与 HPC 运行,并生成含代码的可审计成果。以下是官方给出的 demo,展示了上述功能的实际运行效果

有开发者审查 Claude Code 二进制后发现,它会依据 API 基址和时区悄悄修改系统提示中的日期字符串(撇号与日期分隔符),形成隐写标记以追踪请求来源。该发现引发隐私与安全讨论,在 Hacker News 获得超千点关注。

7. Claude Desktop 推出 Linux 公测版
Anthropic 将 Claude Desktop 桌面端扩展到 Linux,率先支持 Ubuntu 与 Debian 公测。除浏览器与终端外,付费计划用户可在桌面获得与其它平台一致的使用体验,集中集成 Claude Code、Claude Cowork 与聊天等核心能力,覆盖全部付费层级。

OpenAI 工程师本月开发出一项模型推理优化,可将所应用模型的推理成本降低一半以上。该优化已被应用于未登录用户的 ChatGPT 流量,使这部分大规模日常请求的推理开销显著下降,是 OpenAI 在压低服务端推理成本上的最新进展。

Apify 联合 Coinbase 上线 x402 支持,让自主智能体可访问规模最大的网页自动化工具市场。可用工具从约两千个扩展到两万以上,智能体无需账号、API 密钥或人工介入即可完成工具的购买与调用。

10. Google 更新 Gemini Spark 并推出 macOS 版
Google 更新 Gemini Spark,新增 macOS 应用、连接更多 Google 服务和自动化任务体验。官方示例包括持续追踪实习机会等长期任务,显示 Gemini 正从对话助手扩展为可持续执行的个人工作流工具,有助于提升日常生产力。

11. OpenAI 发布 GeneBench-Pro 生物基准
OpenAI 发布 GeneBench-Pro,面向更接近真实科研的计算生物学任务,测试智能体能否处理混乱数据、选择合适分析路径并做出关键判断。该基准把模型评估从标准问答推进到研究流程决策能力。


开发者分享 Anthropic 身份验证准备信息,指向其账户与访问控制流程可能出现新的审核要求。该线索与 Claude 生态账号治理、模型访问门槛和开发者使用连续性相关,影响可能外溢到团队账户,后续仍需关注官方确认。

🔌 AI基础设施
AI 芯片公司 Etched 宣布走出隐身模式,在完成 A0 流片、拿下超 10 亿美元客户合同并筹集 8 亿美元后,已建成首批推理机架。早期客户测试显示其在推理工作负载上达到业界领先的吞吐量、延迟与能效,首批机架将于今夏交付。

服务 6700 万人的电网运营商 PJM 在容量价格两年暴涨 11 倍后,于夏季高温应急期间对 AI 数据中心实施限电。在新规则下,此前已锁定核电合同的运营商占据更有利位置,凸显 AI 基础设施背后的电力博弈。


🧪 芯片半导体
特斯拉聘请一位拥有 17 年英特尔制造经验的资深人士担任 Terafab 总监,成为其奥斯汀芯片晶圆厂项目首位有据可查的领导层。该高管此前负责英特尔 18A 制程的设备安装与产能爬坡,补齐了特斯拉所缺的制造经验。

📌 模型排行榜
16. Artificial Analysis AI 模型能力排行榜
最后是今日的 AI 模型能力排行榜单,闭源三足鼎立,Claude Opus 4.8(max)横扫智力与智能体榜,GPT-5.5(xhigh)拿下代码榜,Gemini 3.5 Flash稳居前列。



以上是今天的AI 风向标,欢迎在评论区提出建议,我们明天见。
266

被折叠的 条评论
为什么被折叠?



