智谱GLM-5.2开源发布,多项测评领先,解锁百万上下文新应用场景!

智谱GLM-5.2发布,测评表现亮眼

6月17日,智谱正式发布并开源了新一代旗舰模型GLM-5.2。在大模型盲测平台竞技场(Arena.ai)的编程评估系统Code Arena上,GLM-5.2拿下1595分的高分,排名总榜第二,仅次于Fable 5,在全球可用模型中排名第一。在测评“超长程、开放式、高难度软件工程任务”的基准测试FrontierSWE中,GLM-5.2排名仅次于Opus 4.8以及暂时不可用的Fable 5。在专门评测模型品味(taste)的Design Arena上,GLM-5.2取得全球第一的表现,审美冲到全球前沿。知乎大V toyama nao打趣,若Opus是GLM-5.2冒充的,用户可能分辨不出。国内外用户对GLM-5.2反响热烈,有开发者称其是国内第一款在工作流上达到Opus级的模型,海外用户反馈其表现超出预期,与Fable 5的差距比预期小。如今Fable 5无法正常使用,海外网友原以为封禁会拉开差距,没想到GLM已快追上来,这让Anthropic头疼。目前,GLM-5.2 API已上线,企业和用户可在Hugging Face等开源平台直接下载并部署该模型。

GLM-5.2进化脉络清晰,跻身顶级俱乐部

此前,智东西对智谱的GLM-4.5、GLM-4.7、GLM-5、GLM-5.1等模型进行了深度体验。GLM-5.2发布后,能感觉到一条清晰的进化脉络:GLM-4.7实现了对彼时顶级编程模型Sonnet 4.6的对齐,而GLM-5.2的“使用体感”已和Opus级模型基本无差别。在AI编程模型领域,此前全球头部玩家长期只有Anthropic(Claude系列)和OpenAI(GPT系列)。此次,GLM-5.2凭借全球可用编程模型第一的榜单成绩和开发者“Opus平替”的真实口碑,正在跻身这一顶级俱乐部,“Coding御三家”格局正在成形。在闭源巨头垄断编程模型话语权且可能收回访问权限的当下,GLM-5.2用开源将选择权交还给了广大开发者。

与GLM-5.2协作编程,展现强大能力

首个实测任务是让GLM-5.2从零开发一款《文明》风格的策略游戏,从M0版本迭代到M4版本。开发前,让GLM-5.2写了一份PRD文档并讨论技术实现,确定使用Godot引擎、GDScript实现2.5D画风的游戏。M0版本中,GLM-5.2创建并编写十几个文件,生成标准地图网格、基础游戏单位等核心内容,开发完成后快速验证并交付。不过该版本较粗糙,有不少小bug。之后在M0阶段逐一优化bug,GLM-5.2在指令下调整多个bug,修复效率不错。跳过M1版本,直接开发M2版本,这是游戏深度的核心,GLM-5.2自主加入战斗系统、科技树、城市经济和资源限制四大子系统,持续工作30多分钟完成。在开发过程中,GLM-5.2严格按规则完成功能并测试。M3版本让游戏从沙盒变成完整单局,GLM-5.2实现敌方战术AI并扩大地图尺寸,还主动考虑游戏优化,让游戏更顺畅。M4版本主要集中在美感和可玩性方面,GLM-5.2展现出不错的审美,如改进UI设计。最后遇到地图扩张后的画面跳动问题,GLM-5.2成功定位问题,可跨越大几十万上下文长度精准定位初版代码中的隐藏bug。完成开发任务后统计,GLM-5.2总计使用87万的上下文窗口,接近极限,且能复盘修复的16个bug,记得每个bug的原因和解法,展现出在百万上下文场景内的可靠记忆。

GLM-5.2处理长文本,优势明显

GLM-5.2 100万上下文的能力可解锁很多其他用途。实测中,一次性上传13份AI领域相关、总时长超30小时、文本量约25万词的播客实录,让GLM-5.2读入后下达解读任务。在跨期观点追踪任务中,GLM-5.2成功识别相关观点,串起观点演进链,最后给出总结,判断目前主要难点在架构层面,并找到相关论述。在主题聚类任务中,GLM-5.2仅用时1分多钟完成梳理,找到9大主题,且抽检关键引语基本无幻觉。用常规上下文窗口的模型处理这类任务会丢失跨实录的逻辑关联和隐性矛盾,让GLM-5.1(20万上下文窗口)试同一个跨期观点追踪任务,其输出总结未能定位跨文件的细节。不过,在轻量级任务上,GLM-5.1和GLM-5.2使用体感差异不明显,如轻量Web UI开发、单文件代码补全、简单脚本编写、日常问答或短文档摘要等任务,两个模型输出质量基本持平,百万上下文优势主要体现在超长任务中。

实现百万上下文,技术协同优化

智谱在GLM-5.2上采用了哪些技术实现百万上下文窗口并有效利用它呢?其实,智谱在GLM-4时代就推出过百万上下文窗口的模型,但大部分模型此前仍维持较小的上下文窗口。在百万级上下文窗口中,单纯强调“长度”意义有限,真正的挑战是解决模型效果不衰减和控制推理成本两个核心问题。GLM-5.2从推理基础设施层面和模型架构层做协同优化,围绕长序列的效率瓶颈,引入IndexShare、KVShare、LayerSplit和HiSparse的组合方案。在模型架构层,改进GLM-5.2的MTP层实现更好的推测解码,应用IndexShare和KVShare的组合方案,减少重复计算。LayerSplit已在GLM-5系列模型“降智”问题优化中得到验证,针对Coding Agent工作负载特点,重点解决KV缓存冗余存储问题,降低单卡显存占用。在基础设施层,LayerSplit同样得到验证,还设计了KV Cache广播与Indexer计算的重叠机制,减少开销。实验结果表明,在32k - 1024k的请求长度区间内,GLM-5.2的系统吞吐量较GLM-5.1实现了3% - 192%的提升,且上下文越长收益越显著。同时,根据模型的稀疏注意力特性,设计了HiSparse分层内存系统,缓解GPU显存压力,最小化关键路径上的数据迁移开销。这些优化使100万上下文“用得起”“好用”。智谱称,GLM-5.2的线上推理依托多个国产算力平台,已在Day 0完成与华为昇腾、平头哥、摩尔线程、寒武纪、昆仑芯、沐曦、海光、壁仞等国产算力平台的推理适配。此外,GLM-5.2还新增了High与Max两档思考强度设定,复杂编码任务中可启用更高档位确保架构级逻辑的严谨性。

GLM-5.2解锁新应用场景,补齐长程任务技术拼图

智谱GLM-5.2的百万级上下文能力将解锁许多新的AI应用场景。例如,在复杂的Web Search类任务中,GLM-5.2可基于公开资料调研主流K12在线编程教育品牌并输出相关数据库、分析报告和图表。结合智谱的Agent产品AutoClaw,GLM-5.2的100万上下文与长程任务能力可服务于设计、法务等白领场景。这些任务的量级和复杂度是其他不具备百万上下文能力的模型难以想象的。回顾智谱近期技术路线,从GLM-5.1将开源模型的长程任务能力推进8小时级,到GLM-5.2以1M上下文进一步延展,技术拼图脉络清晰:先让模型能持续工作更久,再配备足够大的记忆容量。1M上下文解决了长程任务中模型遗忘最初约束的问题。补齐能力拼图后,智谱GLM系列模型在真正工程任务中的可用性有望进一步提升。在实测中,GLM-5.2已完整跑通从理解需求到最终交付的闭环,不再需要逐段拆解任务、反复喂入背景信息、检查中间步骤。当模型既能工作得久又能记得住,才具备成为长期协作伙伴的基础,这也是从“对话式AI”走向“执行式AI”的关键一步。那么,GLM-5.2未来还会带来哪些惊喜呢?

内容概要:本文档围绕“经济学期刊论文复现:数字化转型能否促进企业的高质量发展”这一核心命题,系统整合了MATLAB与Python编程实现的大量科研案例,聚焦于数字化转型对企业全要素生产率(TFP)及高质量发展影响的实证研究。文档不仅复现了高水平经济学期刊论文中的计量经济模型,如基于中国上市公司数据的数字化转型与生产率关系分析,还深度融合了工程领域的建模技术,涵盖微电网优化、负荷预测、风电光伏不确定性建模、电力系统故障仿真等。同时,提供了智能优化算法(如遗传算法、粒子群优化)、机器学习(LSTM、CNN-BiGRU-Attention)、信号处理、路径规划等多学科交叉的技术资源,构建了一个从理论推导到代码实现的完整科研支持体系,旨在帮助研究者系统掌握论文复现与实证分析的核心方法。; 适合人群:具备一定MATLAB或Python编程基础,从事经济学、管理学、能源系统、智能制造及相关交叉学科研究的研究生、科研人员及高校教师。; 使用场景及目标:①复现经济学顶刊中关于数字化转型与企业高质量发展的实证模型;②学习如何量化数字化转型并构建其对企业绩效的影响评估框架;③掌握基于真实数据的计量经济建模、场景生成与优化调度仿真技术,全面提升科研论文写作与实证研究能力。; 阅读建议:建议读者结合文中提供的代码与数据资源,重点研读“论文复现”与“创新未发表”模块,按照技术路径循序渐进地实现模型复现与拓展。推荐关注“荔枝科研社”公众号及百度网盘链接获取完整资料,系统性地开展学习与科研实践。
下载代码方式:https://pan.quark.cn/s/9de6a9d0b3d8 依据所提供的文件内容,能够推导出此段程序的核心任务在于对一个任意的三位数进行拆解,并且分别呈现该数值的百位、十位及个位部分。随后,我们将对该知识点进行进一步的深入研究。 ### 一、程序功能说明 #### 1. 接收任意一个三位数输入 程序起始阶段运用`scanf`函数来获取用户输入的一个整数。为确保输入内容确实为一个三位数,在实际应用场景中通常需要嵌入验证机制来保障输入的有效性。然而,在本示例情形下,该环节被简化处理,预设用户总会准确输入一个三位数。 #### 2. 实施数字的拆分并提取各位置数值 程序借助一系列数学计算来对三位数进行拆分,将其转化为百位、十位和个位三个独立的构成部分。具体而言,通过除法和取模运算完成了这一过程。 #### 3. 展示各位置上的数值 程序运用`printf`函数来输出原始数值以及各个位上的数值。需要留意的是,代码中的输出部分似乎存在一些混淆,存在语法上的错误,例如多余的`printf`语句和乱码字符等问题。 ### 二、核心代码分析 #### 1. 数字拆分逻辑 ```c a[0] = n / 1000; // 提取千位数,但鉴于题目要求是三位数,此处应为百位数 a[1] = n % 1000 / 100; // 提取百位数 a[2] = n % 1000 % 100 / 10; // 提取十位数 a[3] = n % 1000 % 100 % 10; // 提取个位数 ``` 这段代码通过一连串的除法和取模运算,成功地将输入的数字n拆分为百位、十位和个位三个独立的构成部分,...
内容概要:本文提出了一种基于CNN-BiGRU-Attention混合神经网络模型的风电功率预测方法,采用多变量输入实现单步预测,并通过Matlab进行代码实现与验证。该模型融合卷积神经网络(CNN)以提取输入数据的局部时空特征,利用双向门控循环单元(BiGRU)充分捕捉风速、温度、湿度等多源气象与运行变量的时间序列前后依赖关系,并引入注意力机制(Attention)动态加权关键时间步的特征信息,有效提升模型对风电功率波动性和不确定性的建模能力,显著增强了预测的准确性与鲁棒性。; 适合人群:具备一定机器学习与深度学习理论基础,熟悉Matlab编程环境,从事新能源发电预测、电力系统调度、智能电网优化等相关领域的科研人员、工程技术人员及高校研究生。; 使用场景及目标:①应用于实际风电场功率预测系统,为电网调度、电力市场交易与可再生能源消纳提供高精度数据支撑;②作为深度学习在能源时序预测领域的典型案例,用于科研项目开发、学术论文复现与技术创新;③深入理解多变量时间序列预测中特征融合、序列建模与注意力权重分配的协同机制,掌握先进神经网络架构的设计与优化方法。; 阅读建议:建议结合提供的Matlab代码进行实践操作,重点剖析数据预处理流程、模型网络结构搭建、训练参数调优及注意力权重可视化等关键环节,鼓励尝试替换不同特征输入、调整网络深度或引入其他优化算法(如贝叶斯优化、粒子群优化等)以进一步提升模型性能。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值