“DeepSeek出了一个昏招!”

前两天和几个朋友聚会,有个朋友说:“DeepSeek这么厉害,为什么要开源?美国人都知道了,那着高端显卡一练,一下子就把你超了,开源就是昏招,你看人家OpenAI就不开源。”

我虽然当了很久的码农,也知道开源的巨大好处,但是他突然这么一说,我一时还不好反驳。

回来想了想,就写了这篇短文。

美国人走的是算力霸权的路子,高端显卡不允许出口,中国别想用,盟友也得分三六九等。

OpenAI再搞一个闭源的模型,就是把最先进的AI彻底垄断。

这个垄断中,软件部分是OpenAI,硬件是英伟达。

OpenAI+英伟达,会让你想到什么?

f546f3bceaf84fd7ce1141b5a4f50040.png

对,就是Windows + Intel ,当年这哥俩儿在PC市场上“沆瀣一气”,呼风唤雨,把行业利润都吃光了,中国的那些PC厂商全是高级打工仔。

对WinTel联盟,大家恨得牙痒痒,也没有任何办法。

开源、免费的Linux异军突起,让业界看到希望,各个巨头纷纷采用,虽然没有抢下Windows的桌面市场,但把服务器端和移动端快吃光了!

当你弱小、落后,面对领先者的时候,开源是追上去最好的方案,因为可以吸引全世界开发者,让全世界和自己站在一起,然后快速迭代。

OpenAI和DeepSeek的最终目标都是AGI,但是实现它非常难,寻找AGI的过程就像一个刺激的大型寻宝游戏,没有人知道宝藏到底在哪里。

OpenAI率先入场,多探索了一大块区域,看到了更多的线索,祭出Scaling Law法宝,发现了不少好东西,但是它的方案也不一定能走到最后,找到AGI。

开源以后,全世界的人都会尝试,有人往东,有人往西,甚至有人会抛开很容易看到的线索,走上一条新路,例如DeepSeek。

这么多方尝试下来,肯定会有人找到突破口。

一旦开源在技术上超越闭源,闭源就完了,你一家公司怎么可能打败全世界呢?

但这里边的关键点是,你开源的不能是个烂东西,那就没人用了。

而DeepSeek恰恰开源了一个非常牛逼的东西,在达到OpenAI效果的情况下,价格便宜得吓人。这么厉害的东西,还不赶紧安排?

那些巨头虽然还在指责DeepSeek涉嫌抄袭,但动作却一点也不慢,微软、英伟达、亚马逊云科技转身就接入DeepSeek了。

要知道,微软可以在OpenAI上投了上百亿美元啊......

57a3f792a7646aed78772abaff724bf1.jpeg

就连一贯看中国不爽,封杀中国App的印度,也想着部署DeepSeek了,不但想部署,还跃跃欲试,准备搞IndiaAI,毕竟“你们看看DeepSeek做到了什么?仅用了550万美元,就开发出一个非常强大的模型......”

f2e8348e992bfdbf25dd40df589b03ce.jpeg

3f62196b6fef1eb1296f9c61ff7d5a82.jpeg

面对这种盛况,你就说OpenAI更不跟吧?

如果不跟,全世界都在用低成本,高性能的DeepSeek,就不想付高额费用使用OpenAI了。

如果跟,无非两种选择:

第一,跟着DeepSeek走,那之前的算力霸权和闭源的路子就完了。

第二,自己搞一套全新的开源方案,但是能像DeepSeek那样便宜和高性能吗?

无论怎么搞,都是非常难受的。

所以OpenAI CEO 山姆・阿尔特曼最近也承认:“我们过去在开源方面一直站在历史错误的一边...... OpenAI需要‘弄清楚另一种开源战略’”

OpenAI 首席产品官 Kevin Weil 也表示,该公司正在考虑开源较旧的 AI 模型。

其实,DeepSeek完全可以闭源,像OpenAI那样搭建一个网站/提供API    让大家用,但是它会遇到一个需要自证的问题:你不是用不到600万美元就搞了一个媲美OpenAI的大模型吗,如何证明?

现在好了,一开源,任何人都可以使用,复现,效果如何,自己练练就知道了。

这里必须得提一下,DeepSeek开源的是模型的权重,完整的训练框架、系统代码、训练数据并没有开源,这也是现在大模型主流的开源方法。

不过DeepSeek的论文里有详细的技术报告,公开了算法模型结构细节,训练框架的优化,基础设施的优化,所以全世界也掀起了复现的狂潮,Huggingface 推出Open-R1 项目,就是对 DeepSeek-R1 进行全开源复现。

bf627cb2ac92575997e4ffea5d52e9d2.png

开源还占据了道德的制高点:你OpenAI使用了全世界的数据做训练,然后拿出来卖钱,而我的东西端出来随便用,完全符合互联网的分享精神,两者孰高孰低,一目了然。

所以,别看DeepSeek是个140人的小公司,它的开源策略是非常厉害的,不但不是昏招,反而是非常绝妙的。

当然,DeepSeek CEO 梁文峰对开源有着更高追求:

在颠覆性的技术面前,闭源形成的护城河是短暂的。即使OpenAI闭源,也无法阻止被别人赶超。

我们把价值沉淀在团队上,我们的同事在这个过程中得到成长,积累很多know-how,形成可以创新的组织和文化,就是我们的护城河。

全文完,觉得不错的话点个赞或者在看吧!

近期爆文

一个软件Bug,竟然让爱好和平的国家领袖变成了核武器暴君!

小心,美国人又要在基础软件上弯道超车了

世界上最幸福的程序员

世界上最厉害的协作软件,让程序员痛不欲生,最后被印度人搞走了

1970年以来技术的发展趋势,怪不得程序员35岁就被裁......

这个大学生写了个免费软件,全世界网民抢着给他送钱,每月10万美元

全世界流浪的程序员,用最原始的技术,每月赚17.6万美元!

开源软件的叛徒,加入了微软

这两个程序员要花100万,彻底重写世界上最复杂的软件

下载代码方式:https://pan.quark.cn/s/604a73f2a5f9 流量分类机制(IEEE 802.1Qbv)将以太网数据传输划分为多个不同类别,每个类别均被分配特定时段以获取网络访问权,借此构建了类别专属的保护“路径”。依托IEEE 802.1Qcc的优化SRP与性能提升,用户网络接口(UNI)得到扩充,从而支持了远程集中化的网络设置。 ### IEEE 802.1Qbv TSN:流量调度技术详解 #### 一、IEEE 802.1Qbv TSN概述 在当前迅速演进的科技领域中,特别是工业自动化、汽车电子以及高性能计算等领域对实时通信的需求持续上升,时间敏感型网络(Time-Sensitive Networking, TSN)技术随之现。其中,IEEE 802.1Qbv规范是TSN体系中的一个关键构成,主要聚焦于以太网中时间敏感数据流量的管理与调度。 #### 二、IEEE 802.1Qbv标准背景 IEEE 802.1Qbv由IEEE LAN/MAN标准委员会制定,作为IEEE 802.1Q-2014规范的一个延伸,目的是为支持定时传输的数据单元提供更高效、更精准的服务。该规范通过引入时间敏感的流量调度机制,使网络能更好地适应工业控制等环境下的实时性要求。 #### 三、核心概念阐释 **1. 流量调度(Scheduled Traffic)** - **定义**:IEEE 802.1Qbv的核心功能之一是流量调度,它允许依据预定的时间计划来传输不同类型的网络数据。 - **作用**:通过设定优先级和分配时间间隙,保障关键任务数据单元能在规定时限内完成传输,从而增强整个网络的可靠性与确定性。 **2. 类别特定的保护“路径”** - **...
打开链接下载源码: https://pan.quark.cn/s/3e18267cc8f4 ### 倍福PLC从入门到精通 #### 一、系统概述 倍福PLC(Programmable Logic Controller)是一种具有高性能的工业自动化控制设备,其采用了PC架构并融合了实时操作系统TwinCAT,非常适用于复杂多变的工业控制环境。本书着重阐述了倍福PLC的基础理论、安装设置流程以及具体的应用技巧。 **核心知识点:** 1. **原理说明**:倍福PLC基于PC的架构设计,意味着它能够借助PC的强大计算能力和丰富的接口资源来执行复杂的控制任务。同时,通过整合TwinCAT实时操作系统,能够实现高精度的时间同步和低延迟的数据处理性能。 2. **选型建议**:选择合适的倍福控制器至关重要,例如CX系列、CPxxxx系列或Cxxxx系列等,它们各自具有独特的优势,适用于不同的应用场景。选型时需要考虑的因素包括处理速度、I/O接口数量、内存容量等。 3. **安装设置**:详细说明了在Windows操作系统环境下如何安装和配置TwinCAT 2.0软件,涵盖了系统环境的准备、软件安装步骤以及必要的系统设定等。 4. **接线方法**:提供了清晰的接线图示和步骤说明,指导用户正确地将控制器与外部设备连接。 #### 二、编程入门 这一章节主要面向初次接触倍福PLC的用户,通过简单的实例程序来讲解编程的基本流程和技术要点。 **核心知识点:** 1. **编程环境熟悉**:了解TwinCAT 2.0的编程环境,包括开发工具的使用方法和程序结构等。 2. **基础编程技能**:学习如何编写控制逻辑,掌握基本的编程指令如条件语句、循环结构等。 3. **程序调试方法*...
内容概要:本文系统性地介绍了物理信息神经网络(PINNs)在结构力学领域中的应用,重点围绕铁木辛柯梁(Timoshenko Beam)方程的求解展开研究。通过结合PyTorch深度学习框架,构建PINNs模型,将偏微分方程所描述的物理规律作为先验知识嵌入神经网络训练过程,实现对复杂力学系统的高效数值模拟。文章详细阐述了Timoshenko梁理论的控制方程与边界条件,深入解析了如何设计复合损失函数以同时满足微分方程残差、初始条件与边界约束,并完整呈现了从网络架构搭建、数据采样、训练优化到结果可视化的全流程Python代码实现,充分验证了PINNs在固体力学正问题求解中的高精度与无需传统网格划分的独特优势。; 适合人群:具备一定深度学习与连续介质力学基础知识,熟悉PyTorch框架,从事科学计算、工程仿真或交叉学科研究的研发人员与研究生。; 使用场景及目标:① 探索基于深度学习的无网格方法求解复杂偏微分方程的新范式;② 学习如何将物理守恒定律与机器学习模型深度融合;③ 掌握PINNs在梁、板、壳等结构动力学问题中的建模思路与编程实现技巧; 阅读建议:建议读者结合所提供的Python代码逐模块精读,重点关注物理约束的数学形式化表达与损失函数的权重平衡策略,理解梯度计算与自动微分在物理一致性保障中的作用,并尝试迁移该方法至其他类型的微分方程求解任务中进行拓展研究。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值