Sora退场,国产视频模型加速,商业化难题待解!

视频模型赛道竞争激烈,国产厂商迎来加速周期

4月以来,视频模型重新成为AI行业里最拥挤的赛道之一。月初,阿里的HappyHorse - 1.0登顶Artificial Analysis视频竞技场榜单,在无音频文生视频榜单中拿到1368的Elo分,力压Seedance 2.0和可灵3.0。随后,总部位于美国的fal.AI上线HappyHorse - 1.0官方API,此前它已接入可灵、海螺等视频模型。

同一时间,视频模型创业公司开始密集释放资本信号。生数科技和爱诗科技在斩获两笔融资后,先后传出考虑赴港上市的消息。随着阿里正式入场,巨头厂商间的竞争格局愈发激烈。

快手的可灵是业内最早跑出规模商业化的样本,2025年12月单月收入超过2000万美元;字节年初凭借Seedance 2.0的惊艳表现不断做大声量。而在国产视频模型风生水起的几个月中,OpenAI本月关停旗下视频模型产品Sora,宣告视频模型上一个周期结束,也迎来国产视频模型的加速周期。相关统计显示,今年以来,中国AI视频赛道已经发布约10个模型。

巨头三强:各有考题,竞争激烈

参考Artificial Analysis榜单,国产视频模型的头部由三大巨头组成:快手可灵、字节Seedance以及阿里HappyHorse。不过,在榜单上的竞争背后,三家公司面对的是不同的考题。

可灵的关键词是商业化,在技术指标打榜之外,它最早拿出相对清晰的收入账单。公开报道显示,可灵在2025年12月单月收入超过2000万美元,相比2025年3月披露的1亿美元年化收入有明显增长。截至2026年1月,可灵AI年化收入运行率(ARR)已超过3亿美元,快手方面透露出今年将实现收入同比翻倍以上增长的信心。同期,可灵服务超过6000万创作者,累计生成超过6亿条视频,并与超过3万家企业用户建立合作。

可灵自2024年6月开放后,一直是国产视频模型追赶Sora的代表。但进入2026年后,两大竞争对手先后在视频基模领域给可灵“上强度”。Artificial Analysis最新榜单显示,在无音频文生视频榜单中,Kling 3.0 1080p Pro排在第三,前面是阿里和字节的HappyHorse 1.0和Seedance 2.0。值得注意的是,主导HappyHorse的核心人物张迪,此前正是可灵的技术负责人。

Seedance 2.0的关键词是“出圈”。该模型发布后不久,一段由爱尔兰导演Ruairi Robinson用Seedance 2.0生成的“汤姆·克鲁斯与布拉德·皮特”视频在社交平台传播,播放量可观,马斯克都曾评论。其在国内的出圈,也被“雪山救狐狸”带起。字节也在主动推动Seedance 2.0的行业心智,贾樟柯担任监制的春节贺岁短片《贾科长Dance》由其生成,它还参与了央视春晚多个节目的视觉制作。

不过,用户声量的扩张并不完全代表商业层面的胜利。一方面,字节目前没有披露类似可灵那样清晰的ARR口径,在专业级用户市场中与可灵的市场份额占比仍是未知。其次,Seedance 2.0的出圈撞上版权和肖像问题,字节因好莱坞版权争议暂停了其全球发布。

当Seedance还在和版权问题作斗争时,阿里带着HappyHorse抢走了它榜单第一的位置。事实上,HappyHorse - 1.0在无音频文生视频榜单中排第一,Elo分达到1368;而在图生视频有音频榜单中,Seedance 2.0 720p仍然排第一,HappyHorse - 1.0排第二。

腾讯云开发者社区中,有行业人士横评了这三大模型。HappyHorse - 1.0在多镜头测试里表现较好,人物连续性强于Seedance 2.0;音画同步测试里,声画延迟控制优于可灵3.0。然而,物理拟真和复杂规律是HappyHorse的短板。价格比对中,它的720P折后价低于Seedance 2.0和可灵3.0。

阿里与快手、字节存在明显差异。快手有短视频社区,字节有全球化视频工具和分发平台,而阿里没有天然的内容社区。HappyHorse更可能进入阿里云百炼、千问、电商营销等领域,短时间内不会和即梦、可灵正面厮杀。而百度和腾讯今年以来都没有更新视频模型品类,最近一次较明确的视频模型版本发布仍停留在去年10月至11月。至少在2026上半年,视频模型第一梯队将是阿里、字节、快手的三强格局。

第二梯队:上市、融资和路线分化

巨头之外,第二梯队正在分化。4月,生数科技完成20亿元人民币B轮融资,由阿里云领投。产品上,Vidu是生数最重要的抓手,Vidu Q2曾重点推出Reference - to - Video能力。生数的“世界模型”路线更接近视频基座世界模型。

爱诗科技PixVerse是面向全球创作者的视频生成平台,目前传出考虑最快今年赴港上市,并已与中金、摩根大通等投行合作。今年完成3亿美元C轮融资,估值超过10亿美元。营收方面,爱诗科技ARR约4000万美元,生数科技公开可查口径约2000万美元,距离支撑十亿至二十亿美元级估值,还需更强的收入增长等证明。

爱诗更像是“C端规模先跑出来”的公司,生数更像是“技术与模型叙事更强”的公司。但两者共同的问题是,AI视频生成尚未进入稳定盈利期,巨头竞争、算力成本等都可能成为IPO审核和二级市场定价的核心阻碍。

MiniMax旗下的海螺曾经是上一轮国产视频模型热潮里的代表产品,但到2026年,其行业存在感明显不如去年。海螺上一次模型更新是在2025年10月,且面临版权问题。

昆仑万维3月发布的SkyReels V4冲进Artificial Analysis无音频文生视频榜单前列,一度排到第四,目前已全面开放API。但它优先进入自家短剧等生产链路,承担降本工具角色,这部分内部效率能否折算成有效商业化收入仍是未知。

第二梯队每家公司都有出口,但每个出口都不宽。视频模型领域缺少平台优势的厂商,只讲基座模型的故事不够。对于创业/腰部公司而言,视频模型的问题不只在于技术领先程度,更在于ROI的困境。

Sora退场后,视频模型的ROI困境

OpenAI几天前正式关停了Sora,Sora API将于9月24日停止服务。这一举措让迪士尼等合作方感到意外,也意味着一项拟议中的10亿美元合作告吹。OpenAI正把重点转向更有盈利潜力的编码工具和企业解决方案。

这件事揭露了当下视频模型的困境,技术突飞猛进,但商业化难题一直存在。首先是成本问题,视频生成背后是多帧生成等复杂过程,平台承担大量候选结果和算力消耗。AI应用开发平台MindStudio把Sora的失败归结为“推理墙”,Sora关闭前每天推理成本约1500万美元,而生命周期收入约210万美元。

这对国产模型同样成立,以Seedance为例,Sora退场后,Seedance 2.0一度被视为中国视频模型市场最强的挑战者,但字节随后多次上调即梦价格,这意味着AI漫剧素材生成成本大幅上涨。涨价背后是算力账,巨额的算力消耗让模型厂商难以平衡营收和服务质量。

另一方面,版权问题仍是视频模型领域的拦路虎,国内外市场均是如此。爱奇艺在世界大会上的相关事件引发舆论争议,证券时报报道,相关平台都在探索明星人脸授权模式,但有法律界人士表示担忧。

这些问题总结下来还是ROI问题。麦肯锡和德勤的报告都提醒,AI在视频模型领域的承诺和现实价值之间存在差距。真正能穿越周期的公司,必须把生成能力接进生产链路,压低真实交付成本,处理版权合规,并让客户算清ROI。2026年的问题不再是“谁能生成一段更像电影的视频”,而是“如何给客户提供能持续产生营收的服务”。视频模型虽会继续进步,但经历跑分竞赛后,正在跑进深水区。未来,视频模型厂商如何突破困境?

打开链接下载源码: https://pan.quark.cn/s/c43e5bd27521 标题中的“AMD and Nvidia GOP update 1.9.6.rar”表示这是一个包含了AMD与Nvidia显卡的GOP(Graphics Output Protocol)驱动程序升级至1.9.6版本的压缩文件。该更新主要针对显卡在UEFI(统一可扩展固件接口)环境下的图形输出性能进行优化,并致力于提升系统的稳定性。在描述中提及“显卡附加UEFI引导工具,最新版”,表明此次更新内含了一个专为UEFI BIOS环境设计的显卡引导工具,或许表现为一个自启动脚本或程序,例如GOPupd.bat。通过这一工具,用户能够在UEFI模式下对显卡进行精确的配置和初始化,从而保障操作系统能够最大化地发挥显卡的效能。必需的组件包括“colorama-0.4.3”,这是一个在Windows平台上用于管理颜色控制序列的Python模块,可能在更新过程中用于生成彩色命令行显示,以增强用户交互的直观性。此外,“Visual C++Redistributable”是微软提供的运行时支持库,旨在确保基于C++编译的应用程序能够正常运行,此处可能用于更新工具或相关依赖模块。标签“uefi bios”突显了该更新与UEFI BIOS系统的紧密关联,暗示其将作用于计算机的启动序列及硬件初始化过程。压缩包内的文件清单如下: 1. GOPupd.bat - 很有可能是负责执行GPU UEFI引导更新的核心脚本。 2. #Nvidia_ROM_Info.bat 和 #AMD_ROM_Info.bat - 这两个文档可能用于采集Nvidia与AMD显卡的ROM数据,以辅助识别显卡型号并执行适配性验证。 3....
代码下载地址: https://pan.quark.cn/s/a2e2c95e6128 意法半导体(STMicroelectronics)研发的STM32H750是一款性能优越的微控制器,属于STM32H7系列,拥有卓越的处理性能以及多元化的外设接口。在此项工作中,我们将研究如何借助STM32H750达成串口空闲中断(IDLE interrupt)的运用、借助DMA完成UART(通用异步收发传输器)的数据传输,并且探究如何运用STM32CubeMX配置并构建MDK5(Keil uVision5)项目。串口空闲中断是串口通信中的一个核心功能,当串口在一段时间内没有进行数据交换时,会引发该中断。这种功能在需要实时监测串口状态的应用场合中非常有价值,比如,在等待特定指令或需要降低能耗的情况下。在STM32H750中,设定串口空闲中断通常包含以下几个环节: 1. 串口设置:在STM32CubeMX中选定相应的UART接口,并激活中断功能。 2. 中断优先级设定:按照应用需求设定中断优先级。 3. 中断服务函数注册:在程序代码中定义中断服务函数以应对中断事件。 4. 启用串口空闲中断:在初始化代码中激活串口的IDLE位,使能中断。 DMA(Direct Memory Access)传输是一种高效的数据传输机制,它允许外设直接与内存进行交互,无需CPU的介入,从而减轻了CPU的工作负担。在STM32H750中,我们可以运用DMA配合UART来接收数据: 1. DMA配置:在STM32CubeMX中为UART选择合适的DMA通道,并设定传输特性。 2. UART配置:将UART设置为DMA模式,并指定接收缓冲区的地址。 3. 中断配置:开启DMA传输完成中断,以便在数据接收完...
源码直接下载地址: https://pan.quark.cn/s/d64de7ee3e36 STM32CubeIDE是由STMicroelectronics(意法半导体)开发的一款集成开发环境,其核心功能是针对STM32系列微控制器进行优化,并集成了包括源代码编写、编译执行、调试检测以及项目参数设置在内的完整开发工具集。该开发平台依托于Eclipse系统框架构建,旨在为编程人员营造一个便捷且生产力高的工作场景。1.9.0版本属于其产品线中的一个成熟版本,通常包含了若干性能增强措施以及新特性的集成。在嵌入式系统的构建过程中,代码的自动完成机制是一项关键的辅助技术,它能够显著提升工作速率并降低操作失误。专门为这一目的设计的STM32CubeIDE 1.9.0自动代码补全组件,能够有效满足开发者的相关需求。通过将压缩文件中的内容部署到STM32CubeIDE安装路径下的`plugins`子目录中,该插件即可被系统自动检测并激活,从而在代码编写阶段,系统能够基于上下文信息智能地预判并展示潜在的函数名称、变量定义或常量值,进而辅助开发者迅速完成输入任务。基于ARM Cortex-M架构的STM32系列微控制器,在物联网装置、工业自动化系统、个人消费类电子设备等领域具有广泛的部署。在这些应用场景中,单片机扮演着核心角色,而STM32凭借卓越的处理性能、多样化的外部接口配置以及出色的能源控制能力,已成为众多开发者的首选方案。STM32CubeIDE所提供的自动代码补全功能,对于初入行业的开发者而言尤为适宜,因为它能够实时呈现API函数的相关信息,涵盖函数标识符、参数的数据类型与数目,乃至函数的返回类型,从而协助开发者精准地运用STM32的固件库。不仅如此,即便对于已经熟练掌握ST...
内容概要:本文系统阐述了物理信息神经网络(PINNs)在求解布洛赫-托雷(Bloch-Torrey)方程中的实际应用,结合PyTorch框架提供了完整的Python代码实现案例。该方法通过将物理方程的先验知识嵌入神经网络的损失函数中,实现了无需大量标注数据即可高精度求解复杂的偏微分方程,特别适用于科学计算与工程仿真领域。文章不仅展示了PINNs在特定物理模型中的建模流程与实现细节,还强调了科研过程中逻辑严谨性、善用工具与创新思维的重要性,倡导读者循序渐进地学习,避免因过度纠结技术细节而迷失方向。配套的完整代码与资料可通过指定网盘链接或关注公众号“荔枝科研社”获取。; 适合人群:具备扎实数学基础与Python编程能力,从事科研工作或攻读研究生及以上学位的研究人员,尤其适合专注于物理建模、数值仿真、深度学习与科学计算交叉领域的学习者与开发者。; 使用场景及目标:①掌握PINNs求解经典物理方程(如Bloch-Torrey方程)的整体建模思路与代码实现流程;②深入理解如何将物理守恒律与微分算子作为软约束或硬约束融入神经网络训练过程,从而提升模型的泛化性与物理一致性;③为开展相关课题研究、撰写学术论文、复现前沿研究成果或进行跨学科创新提供可靠的技术参考与代码支持。; 阅读建议:建议读者结合所提供的代码实例,逐行调试并可视化训练过程,重点关注损失函数的设计、物理残差项的构建以及网络超参数的调优策略。同时,推荐关注公众号“荔枝科研社”以获取完整资源包,便于进行更深层次的实践拓展与科研创新。
代码下载链接: https://pan.quark.cn/s/a4b39357ea24 EtherCAT(Ethernet for Control Automation Technology)是一种专为自动化技术打造的实时工业以太网通信协议。该协议于2003年由Beckhoff Automation公司发布,凭借其卓越的高速传输能力、极低的延迟以及精准的时间同步性能,在自动化行业中获得了广泛的部署和应用。本文将详细剖析EtherCAT协议的工作原理、系统架构、核心优势以及相关的编程操作实践。 EtherCAT协议虽然基于标准的TCP/IP协议栈,但通过独特的数据传输方案,实现了设备间数据包的高效快速传送。其核心思想在于“分布式时钟”技术,这一机制保证了所有参与设备能够达到微秒级的时间同步精度,这对于需要精确协调的自动化操作而言至关重要。协议的运作模式遵循主从结构,其中主站负责整体的数据调度和交换任务,而从站则承担具体的控制功能。 1. ** EtherCAT协议结构**: 构成EtherCAT网络的基本单元是由一个主站以及多个从站组成,这些从站可以涵盖多种类型的现场设备,例如可编程逻辑控制器(PLC)、各类传感器或执行机构。主站通过在以太网帧中封装控制指令来驱动网络,这些指令信息在从站之间实现无缝传递,每个从站仅处理与其功能相关的数据,并在数据流转过程中进行必要的更新,从而达成高效的数据交互。 2. ** 数据传输**: EtherCAT运用了“反向通道”机制,使得数据在以太网帧的有效载荷区域内进行双向流动。主站发出的指令帧内包含了完整的工作周期数据,从站根据需求提取相关数据,并在返回的响应帧中反馈其状态信息,这种设计显著缩短了通信的延迟时间。 3. ** 时间...
打开链接下载源码: https://pan.quark.cn/s/1a3eab4afa50 《MCGS调试助手V2.52.0——达成高效智能工业自动化调试》 MCGS(Monitor and Control Graphic System)调试助手是一款针对工业自动化领域研发的卓越工具,其最新版本V2.52.0致力于增强用户在系统集成、设备调试环节中的效能与便捷性。该软件在工业控制系统的构建、调试、运行监测等方面扮演着核心角色,为工程师们呈现了一站式的解决策略。 MCGS调试助手的主要特性涵盖: 1. **图形化界面构建**:MCGS集成丰富的图形资源库和可定制组件,使用户能够便捷地设计出直观的监控界面,从而提升操作人员的工作效能和系统的可视化水平。 2. **即时数据获取**:该软件能够与多种PLC、仪表、传感器等硬件设备进行数据交互,完成即时数据的采集与处理,为决策提供精准的数据支持。 3. **逻辑编程支持**:软件兼容梯形图、指令表等多种编程模式,用户可依据实际需求编写控制程序,达成复杂工艺流程的自动化管理。 4. **警示与事件处理**:具备全面的警示功能,能够记录并展示设备运行期间的异常现象,有利于问题的诊断和故障的纠正。 5. **远程监测与故障诊断**:借助网络连接,MCGS调试助手支持用户对设备进行远程的监控与管理,从而减少维护开支,尤其是在广泛分布或难以到达的工业环境中。 6. **数据存储与分析**:系统拥有强大的历史数据存储和检索能力,支持生成数据报告,有助于进行生产数据的评估和改进。 7. **设备互联与物联网整合**:搭配提供的物联网程序补丁升级包,例如U盘方案包,能够轻松实现设备的网络连接,契合工业4.0的发展方向。 在提供的两个U盘方案...
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值