LLM Weekly(2025.11.03-11.09)

在这里插入图片描述

😎 网络热点资讯

Kimi K2 Thinking 重磅发布:Kimi K2 Thinking 引领开源人工智能领域革新,在“人类终极测试”(Humanity’s Last Exam)、BrowseComp 等基准测试中展现顶尖性能。它无需人工干预即可执行 200-300 次工具调用,在推理和创意任务中表现出色。该模型采用量化感知训练(Quantization-Aware Training),实现高速、尖端的推理效果,在智能体搜索、编程及各类任务的推理能力上均取得显著提升。

Qwen3-Max-Thinking:早期预览与基准测试成果:阿里巴巴发布了 Qwen3-Max-Thinking 的早期预览版本,这是一个仍在训练中的中间检查点。借助工具调用增强和算力扩展,该模型在 AIME 2025、HMMT 等高难度推理测试中实现 100% 正确率。用户可通过通义千问(Qwen Chat)和阿里云 API 体验当前版本,后续将推出更多更新。

谷歌计划 11 月发布 Gemini 3 Pro 预览版:谷歌将于 11 月推出 Gemini 3 Pro,用户可通过 VertexAI 提前体验。这款新模型传闻具备 100 万令牌的上下文窗口,适用于海量文档处理。尽管官方细节尚未公布,但有消息称其可能与即将推出的图像模型 Nano Banana 2 相关联,标志着谷歌人工智能产品将迎来重大多

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值