
【小米MiMo V2.5系列开启公测】
4月23日,小米MiMo V2.5系列模型开启公测。据官方介绍,该系列模型推理能力更强、Agent更稳定,还有多模态感知能力,能看懂文本,也能理解图片、音频等信息。在Artificial Analysis榜单中,Xiaomi MiMo - V2.5 - Pro综合智能指数位列全球开源大模型第一。
【MiMo V2.5实测:能力与不足并存】
目前,MiMo V2.5系列已开放公测,小米用户可在MiMo官网体验相关模型产品。虽网页端使用场景不能完全发挥大模型潜力,但可作摸底。通过五个案例测试MiMo V2.5实力。
案例一:文章总结。将雷科技关于ChatGPT Images 2.0评测的图文链接给MiMo V2.5 Pro,它2秒生成结果,准确概括文章优缺点评价。
案例二:盘点小米2025年发布的手机型号。MiMo - V2.5 Pro表现一般,罗列的小米15系列是2024年机型,还遗漏了小米17系列等,且误以为小米15S Pro未发布。其他大模型表现也不完美,Gemini 3.1 Pro虚构出小米16系列,DeepSeek表现相对较好,但也遗漏了小米15S Pro。
案例三:去洗车店洗车该走路还是开车去。MiMo V2.5 Pro未被绕进去,指出洗车前提是车要过去。
案例四:帮看医院检验报告。MiMo V2.5支持多模态,输入医院检查图片,它能识别检查项目并给出结论和建议。普通照片如模糊的、logo被遮挡的Switch图片,它也能准确识别。
案例五:做浏览器能运行的小游戏。MiMo - V2.5 Pro能快速生成解一元二次方程的HTML程序,加大难度写围棋程序也能顺利完成。
【MiMo Claw测试:表现有亮点有不足】
伴随MiMo - V2.5系列发布,小米上线了MiMo Claw,目前处于测试阶段,通过网页端运行,单次体验限时1小时,超时数据销毁可重新创建项目体验。通过三个场景测试其表现。
场景一:新闻抓取。要求搜索当天科技要闻并按怀旧风格生成海报,它模仿90年代杂志风格不错,排版问题不大,但信息联网检索能力一般,时效性不足。
场景二:财报分析。将28页苹果财报PDF文件给MiMo Claw,它精准概括重点并给出结论:iPhone是功臣,研发投入暴增31.7%,服务业务稳健增长但增速放缓,Mac和可穿戴拖后腿,现金流充沛。其工作流是提取文本信息保存为TXT文件,再翻译、分析、归纳总结,但基于网页端运行,与主流网页端大模型差距不大。
场景三:文档优化。小米官方称MiMo Claw与金山生态合作,在Office文档处理有优势。用陈旧排版的大学课件测试,要求着重美化排版参考科技公司Keynote,生成的PPT排版效果变好,字体颜色更正常。
【终端品牌入局大模型,小米有长远规划】
MiMo - V2.5系列大模型及MiMo Claw公测阶段有问题,但模型和Agent能力出色。大规模公测能为小米提供改进方向。MiMo - V2.5系列面向普通用户和开发者,公测同时上线Token付费服务。
小米迭代大模型不只为秀技术和赚服务费,而是深度赋能消费核心业务。如小爱同学融入全模态能力将跨越式进化,从被动指令执行工具转型为超级管家,能看懂屏幕内容、听懂自然语言。
小米AI技术可应用于手机,也能融入「人车家」生态。未来产品蓝图不局限于智能家居和汽车,还包括人形机器人、AI硬件等。如今大模型成为打通智能场景生态的核心大脑,这是智能终端赛道的共识。小米深化人车家全生态,荣耀等厂商也推进底层AI重构,荣耀人形机器人夺冠就是证明,手机厂商正从终端硬件品牌向AI生态品牌转型。未来小米大模型能否持续优化,在生态中发挥更大作用?
967

被折叠的 条评论
为什么被折叠?



