一、算苗科技(SUNMMIO)—— 云端推理「破壁者」
| 维度 | 详情 |
|---|---|
| 成立时间 | 2022年11月,北京 |
| 核心产品 | 3D TokenPU A4E(2026年6月15日流片) |
| 目标场景 | 云端大模型推理(头部大模型厂商客户) |
| 技术路线 | 3D混合键合堆叠 + Tile-Native软硬协同 |
| 指令集架构 | 自研RISC-V架构 |
| 融资情况 | 多轮融资,投资方包括国开金融、北京顺禧、源码资本、石溪资本、联想创投、襄禾资本 |
核心技术亮点
3D堆叠突破内存墙:A4E将8层存储晶圆垂直堆叠在计算逻辑晶圆上,通过硅通孔(TSV)与凸点(bump)技术实现微米级互联,将传统芯片间的「毫米级」传输距离压缩两个数量级,带来 16TB/s 的超大访存带宽。
TokenPU原生架构:跳出通用GPU设计思路,专为大模型推理场景设计,对语言文本、图片、视频乃至世界模型的信息转化Token运算进行全链路优化。GPU诞生于PC图像游戏时代,并非为大模型时代的海量Token处理量身打造。
国产全链路供应链:芯片设计、核心IP、制造、封装全部国产化,采用成熟国产工艺(非先进制程)。核心成员已在高通量存算一体芯片项目中完成万片级3D混合堆叠晶圆量产,是全球少数掌握该技术的团队之一。
Tile-Native软硬协同:将Tile作为数据搬运、存储和计算的基本单元,实现「一次搬运、多次复用」。硬件原生支持Tile级数据调度与多精度动态切换,软件端构建适配LLVM、Triton等开源生态的编译工具栈。
产品路线图
- A4E(2026年6月流片)—— 第一代3D TokenPU
- A4S(计划2027年2月流片)—— 性能翻倍提升
风险与挑战
- 刚流片,距离规模量产(预计2027年同期)仍有12个月以上
- 3D堆叠良率是核心工程挑战
二、光羽芯辰—— 端侧AI「新锐黑马」
| 维度 | 详情 |
|---|---|
| 成立时间 | 2024年7月,上海张江 |
| 核心产品 | 端侧大模型AI加速芯片(首颗已流片,计划2026年底量产) |
| 目标场景 | AI手机、AI PC、智能座舱、机器人等终端设备 |
| 技术路线 | 自研EdgeAIon®架构 |
| 指令集架构 | 基于RISC-V的类CUDA兼容可编程计算平台 |
| 融资情况 | 累计近10亿元 |
| 股东背景 | 燧原科技 + 兆易创新合资设立(各持股15%) |
核心技术亮点
四合一全栈技术:
- 3D堆叠近存算 — 将NPU计算核心与DRAM存储阵列纵向物理融合,大幅缩短数据搬运路径,释放带宽潜力
- SRAM存算一体(CIM) — 在NPU中集成CIM加速引擎,针对VLA模型中计算密集的矩阵运算实现「存中计算」,大幅降低功耗与延迟
- LPU流式处理架构 — 2024年前瞻布局,高效支持FFN运算
- RISC-V AI软件架构 — 打造类CUDA兼容的可编程计算平台
极致能效比:运行大模型速度达 200+ Token/s,计算速度较现行架构提升10倍,功耗仅为同类产品的 1/3。
主导行业标准:作为主要起草单位制定《端侧AI芯片的3D DRAM集成技术规范》《AI算力场景下高带宽存储芯片性能适配技术规范》《大模型训练用存储芯片高速读写稳定性评价方法》等多项团体标准。
顶尖团队:创始人周强博士毕业于复旦大学微电子学院,先后任职于芯原微、AMD、燧原科技、摩尔线程;团队超百人,硕博占比70%以上。
产品路线图
- 首款芯片已流片,2026年底商业化量产
- 以AI PC/AI手机为中轴,向消费电子、AI座舱、具身智能大脑芯片扩展
风险与挑战
- 公司成立于2024年7月,极度年轻,首颗芯片尚未量产
- 端侧市场碎片化严重,生态整合挑战大
三、奕行智能(EVAS)—— RISC-V AI芯片「量产第一人」
| 维度 | 详情 |
|---|---|
| 成立时间 | 2022年1月,广州 |
| 核心产品 | Epoch系列RISC-V AI计算芯片(已大规模量产出货) |
| 目标场景 | 智能汽车 → 数据中心/大模型推理(云-端一体) |
| 技术路线 | 自研EVAMIND™计算架构(类TPU + RISC-V + RVV) |
| 指令集架构 | RISC-V + RVV(向量扩展) |
| 融资情况 | 累计超15亿元(B轮) |
| 商业进展 | 2024年超3倍销售收入增长,头部客户超10亿元订单 |
核心技术亮点
EVAMIND™计算架构:基于RISC-V ISA的AI DSA(领域专用架构),通过在内核上构建指令和数据并行,性能可媲美头部厂商最新一代AI处理器。
三大独创技术:
- VISA(虚拟指令集) — 在软件与硬件之间搭建中间抽象层,解决AI芯片行业长期存在的软件兼容、扩展能力、编译难度三大痛点
- Tile级动态调度架构 — 由Tile级虚拟指令集、智能编译器和硬件调度器三部分组成,实时适配硬件行为,挖掘并行计算潜力。该成果入选 ISCA 2026(计算机体系结构国际顶会)
- 双脉动流水矩阵运算引擎 + 4D DMA引擎 — 类TPU架构,兼顾高性能与高效率
已大规模量产:国内首款RISC-V AI算力芯片Epoch系列正大规模量产出货,已在头部系统厂商、互联网企业、数据中心及重点行业客户中取得重大商业突破。
完整产品矩阵:覆盖芯片→计算模组→整机→大规模系统化产品。
深厚团队:核心成员平均从业超过15年,来自Socionext、安霸、海思、中兴、NVIDIA、AMD、Cadence等。创始人刘珲曾担任Socionext亚太区高级副总裁,拥有超20年芯片行业经验。
产品路线图
- Epoch系列已量产(当前主力)
- 下一代旗舰产品在研
风险与挑战
- 汽车行业导入周期长
- RISC-V软件生态相比ARM/x86仍有差距
四、三家公司横向对比
| 维度 | 算苗科技 | 光羽芯辰 | 奕行智能 |
|---|---|---|---|
| 成立时间 | 2022.11 | 2024.7 | 2022.1 |
| 市场定位 | 云端推理专用 | 端侧AI加速 | 通用AI计算(云-端一体) |
| 架构核心 | 3D TokenPU | EdgeAIon®(3D近存算+PIM+CIM+LPU) | EVAMIND™(类TPU+RISC-V) |
| 指令集 | 自研RISC-V | RISC-V + 类CUDA | RISC-V + RVV |
| 量产状态 | ⏳ 刚流片(2026.6) | ⏳ 已流片,预计2026底量产 | ✅ 已大规模量产 |
| 关键创新 | 16TB/s 3D堆叠带宽 | 端侧四合一技术融合 | VISA虚拟指令+Tile动态调度 |
| 目标市场 | 云端大模型推理 | 手机/PC/座舱/机器人 | 汽车→数据中心→大模型 |
| 融资规模 | 多轮(国资+市场化) | ~10亿元 | 15亿元+ |
| 核心壁垒 | 3D堆叠量产经验 | 全栈端侧技术+标准主导 | 量产规模+ISCA顶会+大额订单 |
| 最大风险 | 量产时间与良率 | 公司太年轻,未出货验证 | RISC-V生态成熟度 |
五、总结
三家公司的技术路线呈现出鲜明的差异化竞争格局:
- 算苗科技走最激进的3D堆叠路线,赌「架构创新替代制程升级」,16TB/s访存带宽是最大亮点,但刚流片,量产仍面临良率考验
- 光羽芯辰是端侧AI技术纵深最强的选手,四项核心技术(3D近存算+PIM+CIM+LPU)形成组合拳,能效比极为突出,但公司成立于2024年,是最年轻的一家
- 奕行智能商业化最为成熟,国内首款RISC-V AI芯片已大规模量产,Epoch系列获得市场验证,学术成果入选ISCA 2026,从汽车领域起步正向云端拓展
三家公司共同点:均押注RISC-V开源指令集,均采用3D堆叠/先进封装技术突破带宽瓶颈,均定位于国产供应链自主可控。
2726

被折叠的 条评论
为什么被折叠?



