算苗科技、光羽芯辰、奕行智能芯片产品全面分析

原创于 2026-06-28 13:59:32 发布 · 348 阅读

6 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#科技

产品定义专栏收录该内容

25 篇文章

订阅专栏

一、算苗科技（SUNMMIO）—— 云端推理「破壁者」

维度	详情
成立时间	2022年11月，北京
核心产品	3D TokenPU A4E（2026年6月15日流片）
目标场景	云端大模型推理（头部大模型厂商客户）
技术路线	3D混合键合堆叠 + Tile-Native软硬协同
指令集架构	自研RISC-V架构
融资情况	多轮融资，投资方包括国开金融、北京顺禧、源码资本、石溪资本、联想创投、襄禾资本

核心技术亮点

3D堆叠突破内存墙：A4E将8层存储晶圆垂直堆叠在计算逻辑晶圆上，通过硅通孔（TSV）与凸点（bump）技术实现微米级互联，将传统芯片间的「毫米级」传输距离压缩两个数量级，带来 16TB/s 的超大访存带宽。

TokenPU原生架构：跳出通用GPU设计思路，专为大模型推理场景设计，对语言文本、图片、视频乃至世界模型的信息转化Token运算进行全链路优化。GPU诞生于PC图像游戏时代，并非为大模型时代的海量Token处理量身打造。

国产全链路供应链：芯片设计、核心IP、制造、封装全部国产化，采用成熟国产工艺（非先进制程）。核心成员已在高通量存算一体芯片项目中完成万片级3D混合堆叠晶圆量产，是全球少数掌握该技术的团队之一。

Tile-Native软硬协同：将Tile作为数据搬运、存储和计算的基本单元，实现「一次搬运、多次复用」。硬件原生支持Tile级数据调度与多精度动态切换，软件端构建适配LLVM、Triton等开源生态的编译工具栈。

产品路线图

A4E（2026年6月流片）—— 第一代3D TokenPU
A4S（计划2027年2月流片）—— 性能翻倍提升

风险与挑战

刚流片，距离规模量产（预计2027年同期）仍有12个月以上
3D堆叠良率是核心工程挑战

二、光羽芯辰—— 端侧AI「新锐黑马」

维度	详情
成立时间	2024年7月，上海张江
核心产品	端侧大模型AI加速芯片（首颗已流片，计划2026年底量产）
目标场景	AI手机、AI PC、智能座舱、机器人等终端设备
技术路线	自研EdgeAIon®架构
指令集架构	基于RISC-V的类CUDA兼容可编程计算平台
融资情况	累计近10亿元
股东背景	燧原科技 + 兆易创新合资设立（各持股15%）

核心技术亮点

四合一全栈技术：

3D堆叠近存算 — 将NPU计算核心与DRAM存储阵列纵向物理融合，大幅缩短数据搬运路径，释放带宽潜力
SRAM存算一体（CIM） — 在NPU中集成CIM加速引擎，针对VLA模型中计算密集的矩阵运算实现「存中计算」，大幅降低功耗与延迟
LPU流式处理架构 — 2024年前瞻布局，高效支持FFN运算
RISC-V AI软件架构 — 打造类CUDA兼容的可编程计算平台

极致能效比：运行大模型速度达 200+ Token/s，计算速度较现行架构提升10倍，功耗仅为同类产品的 1/3。

主导行业标准：作为主要起草单位制定《端侧AI芯片的3D DRAM集成技术规范》《AI算力场景下高带宽存储芯片性能适配技术规范》《大模型训练用存储芯片高速读写稳定性评价方法》等多项团体标准。

顶尖团队：创始人周强博士毕业于复旦大学微电子学院，先后任职于芯原微、AMD、燧原科技、摩尔线程；团队超百人，硕博占比70%以上。

产品路线图

首款芯片已流片，2026年底商业化量产
以AI PC/AI手机为中轴，向消费电子、AI座舱、具身智能大脑芯片扩展

风险与挑战

公司成立于2024年7月，极度年轻，首颗芯片尚未量产
端侧市场碎片化严重，生态整合挑战大

三、奕行智能（EVAS）—— RISC-V AI芯片「量产第一人」

维度	详情
成立时间	2022年1月，广州
核心产品	Epoch系列RISC-V AI计算芯片（已大规模量产出货）
目标场景	智能汽车 → 数据中心/大模型推理（云-端一体）
技术路线	自研EVAMIND™计算架构（类TPU + RISC-V + RVV）
指令集架构	RISC-V + RVV（向量扩展）
融资情况	累计超15亿元（B轮）
商业进展	2024年超3倍销售收入增长，头部客户超10亿元订单

核心技术亮点

EVAMIND™计算架构：基于RISC-V ISA的AI DSA（领域专用架构），通过在内核上构建指令和数据并行，性能可媲美头部厂商最新一代AI处理器。

三大独创技术：

VISA（虚拟指令集） — 在软件与硬件之间搭建中间抽象层，解决AI芯片行业长期存在的软件兼容、扩展能力、编译难度三大痛点
Tile级动态调度架构 — 由Tile级虚拟指令集、智能编译器和硬件调度器三部分组成，实时适配硬件行为，挖掘并行计算潜力。该成果入选 ISCA 2026（计算机体系结构国际顶会）
双脉动流水矩阵运算引擎 + 4D DMA引擎 — 类TPU架构，兼顾高性能与高效率

已大规模量产：国内首款RISC-V AI算力芯片Epoch系列正大规模量产出货，已在头部系统厂商、互联网企业、数据中心及重点行业客户中取得重大商业突破。

完整产品矩阵：覆盖芯片→计算模组→整机→大规模系统化产品。

深厚团队：核心成员平均从业超过15年，来自Socionext、安霸、海思、中兴、NVIDIA、AMD、Cadence等。创始人刘珲曾担任Socionext亚太区高级副总裁，拥有超20年芯片行业经验。

产品路线图

Epoch系列已量产（当前主力）
下一代旗舰产品在研

风险与挑战

汽车行业导入周期长
RISC-V软件生态相比ARM/x86仍有差距

四、三家公司横向对比

维度	算苗科技	光羽芯辰	奕行智能
成立时间	2022.11	2024.7	2022.1
市场定位	云端推理专用	端侧AI加速	通用AI计算（云-端一体）
架构核心	3D TokenPU	EdgeAIon®（3D近存算+PIM+CIM+LPU）	EVAMIND™（类TPU+RISC-V）
指令集	自研RISC-V	RISC-V + 类CUDA	RISC-V + RVV
量产状态	⏳ 刚流片（2026.6）	⏳ 已流片，预计2026底量产	✅ 已大规模量产
关键创新	16TB/s 3D堆叠带宽	端侧四合一技术融合	VISA虚拟指令+Tile动态调度
目标市场	云端大模型推理	手机/PC/座舱/机器人	汽车→数据中心→大模型
融资规模	多轮（国资+市场化）	~10亿元	15亿元+
核心壁垒	3D堆叠量产经验	全栈端侧技术+标准主导	量产规模+ISCA顶会+大额订单
最大风险	量产时间与良率	公司太年轻，未出货验证	RISC-V生态成熟度

五、总结

三家公司的技术路线呈现出鲜明的差异化竞争格局：

算苗科技走最激进的3D堆叠路线，赌「架构创新替代制程升级」，16TB/s访存带宽是最大亮点，但刚流片，量产仍面临良率考验
光羽芯辰是端侧AI技术纵深最强的选手，四项核心技术（3D近存算+PIM+CIM+LPU）形成组合拳，能效比极为突出，但公司成立于2024年，是最年轻的一家
奕行智能商业化最为成熟，国内首款RISC-V AI芯片已大规模量产，Epoch系列获得市场验证，学术成果入选ISCA 2026，从汽车领域起步正向云端拓展

三家公司共同点：均押注RISC-V开源指令集，均采用3D堆叠/先进封装技术突破带宽瓶颈，均定位于国产供应链自主可控。