Anthropic推出Claude Sonnet 5、Claude Fable 5全球重新上线、Google DeepMind发布Nano Banana 2 Lite | 7月1日 AI日报

💡 今日趋势速览:Anthropic发布Claude Sonnet 5,强化自主规划与工具使用;Google DeepMind推出低成本图像模型Nano Banana 2 Lite;Anthropic Fable 5获准全球重新上线。

🎯 今日要点

  1. Anthropic 推出 Claude Sonnet 5,提升代理能力
  2. Google DeepMind 发布 Nano Banana 2 Lite 与 Omni Flash
  3. Anthropic Fable 5获准全球重新上线

📋 今日内容汇总

🤖 AI动态

  1. Anthropic 推出 Claude Sonnet 5,提升代理能力
  2. Google DeepMind 发布 Nano Banana 2 Lite 与 Omni Flash
  3. Anthropic Fable 5获准全球重新上线
  4. Claude Sonnet 5被曝准备登陆OpenRouter
  5. Anthropic 推出 Claude Science 科研工作台
  6. Claude Code 被发现对请求做隐写式标记
  7. Claude Desktop 推出 Linux 公测版
  8. OpenAI 工程师开发推理优化使成本减半
  9. x402 将智能体可购工具规模扩大十倍
  10. Google 更新 Gemini Spark 并推出 macOS 版
  11. OpenAI 发布 GeneBench-Pro 生物基准
  12. Anthropic 身份验证准备信息曝光

🔌 AI基础设施

  1. Etched 走出隐身模式建成首批推理机架
  2. PJM 紧急限电预示 AI 数据中心电力博弈

🧪 芯片半导体

  1. 特斯拉挖角英特尔老兵执掌 Terafab 晶圆厂

📌 模型排行榜

  1. Artificial Analysis AI 模型能力排行榜

🤖 AI动态

1. Anthropic 推出 Claude Sonnet 5,提升代理能力

今日 Anthropic 的新闻比较多,首先是 Claude Sonnet 5 模型发布,其具备更强的自主规划与工具使用能力,可操作浏览器和终端。该模型在推理、编码和知识工作方面显著超越 Sonnet 4.6,性能接近 Opus 4.8 但价格更低,标志着 AI 代理能力的重要进步。

Anthropic 推出 Claude Sonnet 5,提升代理能力

Anthropic 推出 Claude Sonnet 5,提升代理能力

Anthropic 推出 Claude Sonnet 5,提升代理能力

2. Google DeepMind 发布 Nano Banana 2 Lite 与 Omni Flash

Google DeepMind 推出图像模型 Nano Banana 2 Lite,为该系列速度最快、成本最低,文本到图像仅需 4 秒、每千分辨率成本 0.034 美元此外, 同步推出 Gemini Omni Flash支持高画质视频生成与对话式编辑,视频定价 0.1 美元每秒。以下是官方给出的 demo 视频,使用 Omni Flash 制作的魔术表演。

Google DeepMind 发布 Nano Banana 2 Lite 与 Omni Flash

Google DeepMind 发布 Nano Banana 2 Lite 与 Omni Flash

Google DeepMind 发布 Nano Banana 2 Lite 与 Omni Flash

3. Anthropic Fable 5获准全球重新上线

爆料称,Anthropic 已获准在正式解除限制后全球重新上线 Fable 5,发布时间可能等团队恢复办公后推进。该消息显示围绕 Anthropic 新模型的监管与发布节奏仍在快速变化,包括可用地区仍需等待官方确认。

Anthropic Fable 5获准全球重新上线

4. Claude Sonnet 5被曝准备登陆OpenRouter

TestingCatalog 发现 Claude Sonnet 5 正以 20260630 代号准备登陆 OpenRouter,暗示 Anthropic 新模型可能进入第三方聚合平台。该线索尚未等同正式发布,但反映模型分发渠道和上线节奏值得跟踪,需要继续观察官方和平台页面变化。

Claude Sonnet 5被曝准备登陆OpenRouter

Claude Sonnet 5被曝准备登陆OpenRouter

5. Anthropic 推出 Claude Science 科研工作台

Anthropic 推出 AI 科研工作台 Claude Science,整合常用工具与计算资源,支持从文献分析到多步骤研究的全流程。它提供超 60 项预配置技能,覆盖基因组学、蛋白质组学等领域,可在本地或通过 SSH 与 HPC 运行,并生成含代码的可审计成果。以下是官方给出的 demo,展示了上述功能的实际运行效果

Anthropic 推出 Claude Science 科研工作台

6. Claude Code 被发现对请求做隐写式标记

有开发者审查 Claude Code 二进制后发现,它会依据 API 基址和时区悄悄修改系统提示中的日期字符串(撇号与日期分隔符),形成隐写标记以追踪请求来源。该发现引发隐私与安全讨论,在 Hacker News 获得超千点关注。

Claude Code 被发现对请求做隐写式标记

7. Claude Desktop 推出 Linux 公测版

Anthropic 将 Claude Desktop 桌面端扩展到 Linux,率先支持 Ubuntu 与 Debian 公测。除浏览器与终端外,付费计划用户可在桌面获得与其它平台一致的使用体验,集中集成 Claude Code、Claude Cowork 与聊天等核心能力,覆盖全部付费层级。

Claude Desktop 推出 Linux 公测版

8. OpenAI 工程师开发推理优化使成本减半

OpenAI 工程师本月开发出一项模型推理优化,可将所应用模型的推理成本降低一半以上。该优化已被应用于未登录用户的 ChatGPT 流量,使这部分大规模日常请求的推理开销显著下降,是 OpenAI 在压低服务端推理成本上的最新进展。

OpenAI 工程师开发推理优化使成本减半

9. x402 将智能体可购工具规模扩大十倍

Apify 联合 Coinbase 上线 x402 支持,让自主智能体可访问规模最大的网页自动化工具市场。可用工具从约两千个扩展到两万以上,智能体无需账号、API 密钥或人工介入即可完成工具的购买与调用。

x402 将智能体可购工具规模扩大十倍

10. Google 更新 Gemini Spark 并推出 macOS 版

Google 更新 Gemini Spark,新增 macOS 应用、连接更多 Google 服务和自动化任务体验。官方示例包括持续追踪实习机会等长期任务,显示 Gemini 正从对话助手扩展为可持续执行的个人工作流工具,有助于提升日常生产力。

Google 更新 Gemini Spark 并推出 macOS 版

11. OpenAI 发布 GeneBench-Pro 生物基准

OpenAI 发布 GeneBench-Pro,面向更接近真实科研的计算生物学任务,测试智能体能否处理混乱数据、选择合适分析路径并做出关键判断。该基准把模型评估从标准问答推进到研究流程决策能力。

OpenAI 发布 GeneBench-Pro 生物基准

OpenAI 发布 GeneBench-Pro 生物基准

12. Anthropic 身份验证准备信息曝光

开发者分享 Anthropic 身份验证准备信息,指向其账户与访问控制流程可能出现新的审核要求。该线索与 Claude 生态账号治理、模型访问门槛和开发者使用连续性相关,影响可能外溢到团队账户,后续仍需关注官方确认。

Anthropic 身份验证准备信息曝光

🔌 AI基础设施

13. Etched 走出隐身模式建成首批推理机架

AI 芯片公司 Etched 宣布走出隐身模式,在完成 A0 流片、拿下超 10 亿美元客户合同并筹集 8 亿美元后,已建成首批推理机架。早期客户测试显示其在推理工作负载上达到业界领先的吞吐量、延迟与能效,首批机架将于今夏交付。

Etched 走出隐身模式建成首批推理机架

14. PJM 紧急限电预示 AI 数据中心电力博弈

服务 6700 万人的电网运营商 PJM 在容量价格两年暴涨 11 倍后,于夏季高温应急期间对 AI 数据中心实施限电。在新规则下,此前已锁定核电合同的运营商占据更有利位置,凸显 AI 基础设施背后的电力博弈。

PJM 紧急限电预示 AI 数据中心电力博弈

PJM 紧急限电预示 AI 数据中心电力博弈

🧪 芯片半导体

15. 特斯拉挖角英特尔老兵执掌 Terafab 晶圆厂

特斯拉聘请一位拥有 17 年英特尔制造经验的资深人士担任 Terafab 总监,成为其奥斯汀芯片晶圆厂项目首位有据可查的领导层。该高管此前负责英特尔 18A 制程的设备安装与产能爬坡,补齐了特斯拉所缺的制造经验。

特斯拉挖角英特尔老兵执掌 Terafab 晶圆厂

📌 模型排行榜

16. Artificial Analysis AI 模型能力排行榜

最后是今日的 AI 模型能力排行榜单,闭源三足鼎立,Claude Opus 4.8(max)横扫智力与智能体榜,GPT-5.5(xhigh)拿下代码榜,Gemini 3.5 Flash稳居前列。

Artificial Analysis AI 模型能力排行榜

Artificial Analysis AI 模型能力排行榜

Artificial Analysis AI 模型能力排行榜

以上是今天的AI 风向标,欢迎在评论区提出建议,我们明天见。

内容概要:本文围绕列车-轨道-桥梁交互仿真研究,基于Matlab平台构建数值模型,系统分析列车运行过程中轨道与桥梁结构间的动态相互作用机制。研究涵盖多体动力学建模、耦合系统运动方程求解、边界条件设定及仿真结果可视化等关键环节,重点揭示高速行车条件下基础设施的振动传递规律与力学响应特征。该仿真方法可有效评估结构安全性、舒适性指标及疲劳寿命,为轨道交通工程的设计优化与运维管理提供理论支撑和技术路径。文中配套提供了完整的Matlab代码实现方案及操作说明,便于用户复现、验证和拓展相关研究。; 适合人群:具备Matlab编程基础和结构动力学、车辆动力学等相关专业知识的研究生、科研人员及从事铁路工程、桥梁工程与交通系统安全评估的工程技术人才,尤其适合开展轨道交通耦合振动课题的研究者。; 使用场景及目标:①用于高校与科研机构进行列车-轨道-桥梁耦合系统动力学特性的教学演示与科学研究;②支撑高速铁路桥梁的设计优化、运营安全性评估与减振降噪方案验证;③为复杂交通基础设施的多物理场耦合仿真提供建模思路与代码参考。; 阅读建议:建议读者结合所提供的Matlab代码逐模块深入研读,重点关注系统建模假设、质量-刚度-阻尼矩阵构建方法及数值积分算法的实现细节,同时可通过调整参数进行敏感性分析,进一步掌握仿真模型的适用范围与优化方向。
内容概要:本文系统研究了非线性薛定谔方程的物理信息神经网络(PINN)求解方法,提出一种将物理规律嵌入深度学习模型的科学计算新范式。通过构建全连接神经网络架构,将非线性薛定谔方程及其初始/边界条件作为损失函数的核心组成部分,实现了在无须大量标注数据的前提下对复值偏微分方程的高精度数值求解。该方法充分利用自动微分技术精确计算方程残差,有效融合了数据驱动与模型驱动的优势,在光学孤子传播、量子系统演化等典型场景中展现出优异的逼近能力与泛化性能。文中配套提供了完整的Python实现代码,涵盖网络搭建、损失定义、训练优化与结果可视化全流程。; 适合人群:具备Python编程能力与深度学习基础知识,熟悉偏微分方程理论及科学计算的理工科研究生、科研人员,以及从事光学、量子物理、流体力学等领域建模与仿真的工程技术人员。; 使用场景及目标:① 掌握PINN方法的基本原理与实现技巧;② 学习如何将复杂物理方程转化为可训练的神经网络损失项;③ 应用于非线性光学、玻色-爱因斯坦凝聚、水波动力学等问题的仿真与预测;④ 为相关科研课题提供可复现的算法原型与代码参考。; 阅读建议:建议读者结合所提供的Python代码进行动手实践,重点理解神经网络对微分算子的近似机制、损失函数的多任务加权策略以及训练过程中的超参数调优方法,进而可迁移至其他非线性偏微分方程的求解任务,拓展其在交叉学科中的应用边界。
源码下载地址: https://pan.quark.cn/s/a4b39357ea24 微软推出的【AZ-900微软认证】是一项针对初学者的基础级云服务资格认证,其目的在于帮助学习者掌握云概念、微软Azure服务的运作机制以及云解决方案的核心知识。获得这一认证后,考生将能够清晰地理解云计算领域的基础术语、服务模式(包括IaaS、PaaS、SaaS等)以及这些服务在Azure平台上的实际应用方式。 在【必过考题】部分,我们可以观察到两个重点议题,它们分别聚焦于PaaS(平台即服务)的概念阐释和云成本的计算方式。 在第一个议题中,考生被要求辨别关于PaaS的正确性描述。PaaS平台提供了一个开发环境,但并不允许用户直接访问操作系统(Box 1: No)。比如,Azure Web Apps服务可以用来部署web应用,但用户无法直接管理虚拟机或IIS系统。另一方面,PaaS确实具备自动扩展的功能(Box 2: Yes),这表示可以根据实际需求自动增加负载均衡的虚拟机以支持web应用的运行。PaaS框架还为开发人员提供了构建和调整云端应用的工具,预置的应用组件能够有效缩短新应用的编程周期(Box 3: Yes)。 第二个议题同样关注云计算理念的理解,尤其强调IT支出从资本性支出(CapEx)向运营性支出(OpEx)的转型思想。传统的IT投资通常被视为CapEx,而云计算的按需付费机制使企业能够将这部分开支转化为OpEx,从而在财务规划上获得更大的自由度。 在为AZ-900考试做准备时,考生需要特别关注以下几个核心知识点: 1. **云服务模式**:深入理解IaaS(基础设施即服务)、PaaS和SaaS(软件即服务)之间的差异及其各自的应用情境。 2. **Azure服务*...
源码下载地址: https://pan.quark.cn/s/239a0d536a1e 依据所提供的文件资料,可以归纳出以下核心内容:由清华大学计算机系邓俊辉教授精心编纂的算法训练营题目合集,对于CSP(中国软件专业人才设计与创业大赛)及PAT(程序设计能力测试)这类编程竞赛具有极高的参考价值,堪称一份极具价值的参考资料。此类竞赛普遍对参赛者的算法功底和编程技巧提出严苛要求。该合集中的题目与算法领域紧密相连,其中包含了“最大红矩形”这一典型题目。所谓最大红矩形题目,其核心任务是针对一个由红色与绿色方格构成的棋盘,寻觅出最大的纯红矩形区域。要攻克这一问题,必须运用数据结构与算法的相关知识,特别是栈这一数据结构的应用。 “最大红矩形”问题能够被抽象转化为“直方图最大面积”问题。具体转化方法是将棋盘的每一列视为一个独立的直方图单元,其中红色方格的贡献体现为当前位置与前一个绿色方格所在行数的差值,从而保证每个直方图的基宽恒定为1。随后,借助扫描直方图的技术手段来探寻最大矩形面积。这一过程需要对每个直方图进行系统性遍历,并利用栈来记录各直方图的下标信息。一旦检测到当前直方图的高度小于栈顶元素所记录的高度,则意味着遭遇了一个“高点”,此时需计算以该“高点”为右边界条件的最大矩形面积。 在编程实践环节,必须高度关注栈的操作细节,以及如何精确地初始化和操纵栈来应对直方图问题。代码实现中,通常配置两个栈,一个用于储存直方图的高度值,另一个用于标记直方图的下标位置。当面对新高度时,需审慎判断当前高度与栈顶高度的相对关系,并据此抉择是执行入栈操作还是计算面积。针对“低点”(即当前高度小于栈顶),应直接将当前高度纳入栈中;而对于“高点”,则需执行弹出栈顶元素的操作,并基于该栈顶元素的高...
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

一只云卷云舒

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值