
见证历史!
两款中国o1大模型一夜席卷硅谷,在海外杀疯了!


这两个国产o1模型持续引起海外AI社区热议,并且一度在全球程序员最爱逛的网站 Hacker News 上分别排名第一和第四。

没错,这就是国产AI公司 DeepSeek 和月之暗面几乎同时发布的对标 OpenAI o1的新模型 DeepSeek-R1 和 Kimi k1.5,没曾想,一夜火爆外网。

这两天一打开推特就是关于这两国产个o1模型的讨论,海外网友也是被惊到了。
甚至有网友激动地表示:
中国的 AI 公司正在把中国新年变成整个全球人工智能社区的庆祝活动。
现在OpenAI o1的秘密已经大白于天下。没有PRM,没有MCTS,没有复杂的配方。大规模的可验证数据将让推理和自我反思与任何强化学习算法一起出现!

真的确实如此,如果没有 DeepSeek-R1和 Kimi k1.5的发布,OpenAI 所引以为豪、藏着掖着的o1不知道还要被多少人奉为圭臬。
如今这个王者被两个国产o1模型赶上,这两个模型的基准测试结果很惊艳。
比如拿Kimi k1.5 举例,在 long-CoT 模式下,Kimi k1.5 的数学、代码、多模态推理能力,都达到甚至部分超过了 OpenAI o1 正式版的水平。这应该是全球范围内,OpenAI 之外的公司首次实现 o1 正式版的多模态推理性能。

一、国产版o1是如何炼成的?有何异同?
几乎同一时间出现两款对标 o1的国产模型,很难不让人怀疑这两个团队之间是否存在技术泄密?
好在 DeepSeek-R1 和 Kimi k1.5 的技术路线有相似之处但并不相同,可以说两者都是国产AI技术原创的代表之作。
英伟达AI科学家 Jim Fan 在推特上特意对两者进行了技术解读:

总结下来就是:
-
DeepSeek采用AlphaZero方法——完全通过强化学习与人类输入进行自我引导,无需任何监督微调。
Kimi则采用AlphaGo-Master方法:通过提示工程化的CoT(思维链)轨迹进行轻量级SFT预热。
-
Kimi的论文在系统设计方面有更多细节:强化学习基础设施、混合集群、代码沙盒、并行策略等;在学习细节方面包括长上下文、CoT压缩、课程学习、采样策略、测试用例生成等。
除了国外网友,国内也出现很多自来水文章对其进行了详细的技术解读。

此外我很想推荐在知乎上刷到一篇 Kimi 研究员关于o1之路的背后回答,感觉写的非常精彩,贴出来给大家看看。

文章很长,上面只贴了一部分,强烈大家去完整读一下原文。
其中我最喜欢的是下面👇🏻这段堪称顿悟的思考,简直绝了。
我猜这位研究员在这一刻一定很幸福吧。
o1 即 人生。人生就是一条有限的串行轨迹,各种探索,各种犯错,最终的结局都取决于自己的目标。

二、国产o1的下一步?
我除了上面论述的技术路线之外,这两个模型还有明显不同,对用户体验影响最大的就是, DeepSeek-R1 是文本推理模型,而 Kimi k1.5 则同时支持文本、视觉多模态推理模型。
比如让两个模型各自把自己家的Benchmark图整理为表格, 就必须要有视觉能力,才能做到。
为何要强调多模态呢?因为这两家公司的使命都是实现AGI,而AI圈的一个共识则是多模态才更接近AGI,因为人类生活的世界就是一个多模态世界,AI想要真正走进千家万户服务人类,必然要能看会听擅说,所以说多模态是通往AGI的必经之路。
我注意到 Kimi 在官方推文中公布了自家的 k 系列思考模型的路线图,可以说 Kimi 三个月三次新模型的突破确实也是这样践行的,这个速度实在令人瞠目结舌。
并且我大胆合理猜测一下,Kimi 下一代多模态会支持上语音模态,这几天豆包、智谱等模型其实已经在卷这个赛道了,就看 Kimi 能不能做到更强。

其实这两家公司还有一个共同特点,那就是恐怖的技术实力背后——恐怖的人才密度。
两家公司都有着国内最顶尖的AI青年科学家和程序员。令人意外的是,这次的技术报告paper里,两家公司居然都大大方方地列出了名单——技术猎头们该狂喜了(狗头)。这个等后面有时间了专门扒一扒出一篇文章。
三、OpenAI 神话被打破,国产AI真的在崛起了
这两年很多人都在喊国产AI崛起了,但我觉得光是国内自己喊属实是自吹自擂。
但这次好像真的和之前不一样,这次不是我们自己在喊,而是海外友人替我们喊,他们比我们还要更疯狂。
比如在 Hacker News 上,有网友开始激辩中国AI的追赶速度:
-
3 个领先模型中有2个来自中国实验室吗?中国追赶的速度真是令人难以置信。
-
令人惊讶和着迷的是中国如何专注于用更少的资源做更多的事情一-他们在硬件方面的劣势地位推动了对模型效率和精炼的巨大关注,以造福我们所有人。
-
我认为非常有可能虽然第一个说"hello world"的 AGI 可能会用英语说,但第一个在消费类硬件上运行的开源 AGI 可能会用普通话说。

除了网友自来水之外,就连美国知名科技媒体 TechCrunch 也及时报道了中国AI的进展。
到目前为止,至少有三家中国实验室–Deepseek、阿里巴巴和由独角兽公司月之暗面(Moonshot Al)拥有的Kimi–已经开发出了他们声称可以匹敌 0penAl o1的模型。

真的,东方AI力量正在给海外网友带来亿点点震撼。
海外AI社区一夜之间多出很多「 OpenAI 难民」。
而 OpenAI 仿佛 一瞬间成为了一只待宰的羔羊,人人都能分一口肉。
OpenAI 作为很多AI技术范式的开创者,它的强大实力当然还在,这点不可否认,但 OpenAI 给人的技术光环和统治力却在一点点逐渐下降。
似乎这次中国AI的带来的狂热真的让 Sam Altman 都感到慌了…
很多网友寄希望于 OpenAI 下个月就能实现 AGI,Sam Altman 只能亲自发推辟谣来降温。

美国精英阶层从上到下都普遍开始慌了…
硅谷技术天才亚历山大王甚至公开给美国政府写如何在人工智能领域领先中国的建言书。

不知道是不是巧合,就在发文之前,今天早上美国政府官宣了OpenAI 联合软银等巨头斥巨资来建设人工智能基础设施中心。

该项目命名为星际之门,计划在未来四年内投资 5000 亿美元,由软银负责拉钱,OpenAI 负责运营,软银的老板孙正义将担任董事长,Oracle和英伟达将提供数据和算力支持。

我觉得这就是美国在AI时代新的曼哈顿计划。
中国人工智能的发展迎来了认可,也迎来了更大的挑战。
期待中国涌现出更多像DeepSeek和 Kimi 一样的公司——
用更少的资源实现最顶尖的技术创新,努力做出全球最顶尖的AI模型,最终迈向AGI。
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】


第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

6万+

被折叠的 条评论
为什么被折叠?



