简介
开源大模型推理加速框架vLLM创始团队成立Inferact公司,获1.5亿美元种子轮融资,估值8亿美元。公司致力于将vLLM发展为世界领先的AI推理引擎,降低推理成本并加速AI发展。vLLM已支持500多种模型架构,在200多种加速器上运行,拥有2000多名贡献者,是业界最受欢迎的开源大模型推理加速框架之一。
大模型推理的基石 vLLM,现在成为创业公司了。
北京时间周五凌晨传来消息,由开源软件 vLLM 的创建者创立的人工智能初创公司 Inferact 正式成立,其在种子轮融资中筹集了 1.5 亿美元(约合 10 亿元人民币),公司估值达到 8 亿美元。

本轮融资由风险投资公司 Andreessen Horowitz(a16z)和 Lightspeed 领投,Sequoia Capital、Altimeter Capital、Redpoint Ventures 和 ZhenFund 也参与了投资。
Inferact 的 1.5 亿美元天使轮融资虽不及 Ilya Sutskever 的公司 SSI 的 10 亿美元,但已经超过了 Mistral AI 的 1.15 亿美元,是有史以来规模最大的种子轮融资之一,标志着业界对于 AI 推理基础设施的重视程度正在急速提升。
Inferact 的使命是将 vLLM 发展成为世界领先的 AI 推理引擎,并通过降低推理成本、加快推理速度来加速 AI 的发展。
该公司认为,AI 行业未来面临的最大挑战不是构建新模型,而是如何以低成本、高可靠性地运行现有模型。
毫无疑问,Inferact 的核心是开源项目 vLLM,这是一个于 2023 年启动的开源项目,旨在帮助企业在数据中心硬件上高效运行 AI 模型。

vLLM 最初由加州大学伯克利分校(UC Berkeley)的天空计算实验室 (Sky Computing Lab) 开发,现由 PyTorch 基金会负责管理,已吸引了来自整个 AI 行业的 2000 多名贡献者,是全球范围内最受欢迎的开源大模型推理加速框架。
如今,vLLM 的推理能力在为 Meta、谷歌、Character.AI 等科技公司提供支持。
Inferact 的首席执行官 Simon Mo 是一位伯克利在读博士生,他是 vLLM 的创始维护者之一。Mo 表示,公司成立于 2025 年 11 月,并于本周正式对外公布。他将 Inferact 的起源与伯克利早期的一些软件项目进行了比较,这些项目后来发展成为规模更大的企业,例如 Apache Spark 和 Ray。

在宣布融资的同时,Lightspeed(光速创投)也发布了对 Simon Mo 的访谈。在其中 Simon Mo 谈到了对于全球 AI 算力紧缺的担忧,「当前用于大模型训练的 AI 集群,将在六个月内完全被用于推理…… 推理会逐渐消耗掉所有算力容量,并耗尽所有新增的容量。」
在公告中,Inferact 表示,其定位于模型和硬件的交汇点:当模型厂商发布新架构时,他们会与 vLLM 合作,确保提供首日支持;当硬件厂商开发新芯片时,他们会与 vLLM 集成;当大模型团队进行大规模部署时,他们会运行 vLLM,从前沿实验室到超大规模数据中心,再到服务数百万用户的初创公司,无一例外。
如今,vLLM 支持了 500 多种模型架构,可在 200 多种加速器上运行,并支持着全球规模的推理。这个由 2000 多位贡献者共同构建的生态系统,是 Inferact 得以成立的基础。
Inferact 表示,其首要任务是继续支持 vLLM 作为独立的开源项目,并将改进成果分享给社区。他们计划进一步提升 vLLM 的性能,深化对新兴模型架构的支持,并扩大对前沿硬件的覆盖范围。Inferact 的第二个目标是开发一款独立的商业产品,帮助企业在不同类型的硬件上更高效地运行 AI 模型。
值得关注的是,vLLM 项目的核心贡献者清华博士游凯超成为了这家公司的联合创始人。

据介绍,Inferact 的创始团队包括 Simon Mo、Woosuk Kwon、Kaichao You(游凯超)、Roger Wang、Joseph Gonzalez、Ion Stoica 等人。
说真的,这两年看着身边一个个搞Java、C++、前端、数据、架构的开始卷大模型,挺唏嘘的。大家最开始都是写接口、搞Spring Boot、连数据库、配Redis,稳稳当当过日子。
结果GPT、DeepSeek火了之后,整条线上的人都开始有点慌了,大家都在想:“我是不是要学大模型,不然这饭碗还能保多久?”
我先给出最直接的答案:一定要把现有的技术和大模型结合起来,而不是抛弃你们现有技术!掌握AI能力的Java工程师比纯Java岗要吃香的多。
即使现在裁员、降薪、团队解散的比比皆是……但后续的趋势一定是AI应用落地!大模型方向才是实现职业升级、提升薪资待遇的绝佳机遇!
这绝非空谈。数据说话
2025年的最后一个月,脉脉高聘发布了《2025年度人才迁徙报告》,披露了2025年前10个月的招聘市场现状。
AI领域的人才需求呈现出极为迫切的“井喷”态势

2025年前10个月,新发AI岗位量同比增长543%,9月单月同比增幅超11倍。同时,在薪资方面,AI领域也显著领先。其中,月薪排名前20的高薪岗位平均月薪均超过6万元,而这些席位大部分被AI研发岗占据。
与此相对应,市场为AI人才支付了显著的溢价:算法工程师中,专攻AIGC方向的岗位平均薪资较普通算法工程师高出近18%;产品经理岗位中,AI方向的产品经理薪资也领先约20%。
当你意识到“技术+AI”是个人突围的最佳路径时,整个就业市场的数据也印证了同一个事实:AI大模型正成为高薪机会的最大源头。
最后
我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。
我整理出这套 AI 大模型突围资料包【允许白嫖】:
-
✅从入门到精通的全套视频教程
-
✅AI大模型学习路线图(0基础到项目实战仅需90天)
-
✅大模型书籍与技术文档PDF
-
✅各大厂大模型面试题目详解
-
✅640套AI大模型报告合集
-
✅大模型入门实战训练
这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

①从入门到精通的全套视频教程
包含提示词工程、RAG、Agent等技术点

② AI大模型学习路线图(0基础到项目实战仅需90天)
全过程AI大模型学习路线

③学习电子书籍和技术文档
市面上的大模型书籍确实太多了,这些是我精选出来的

④各大厂大模型面试题目详解

⑤640套AI大模型报告合集

⑥大模型入门实战训练

👉获取方式:
有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

1578

被折叠的 条评论
为什么被折叠?



