
罗福莉在小米的第二份答卷,已经交了出来。
3月19日,小米正式发布了号称“面向Agent时代”的旗舰基座模型 Xiaomi MiMo-V2-Pro,同时亮相的还有全模态基座模型 Xiaomi MiMo-V2-Omni 以及语音合成模型 Xiaomi MiMo-V2-TTS。此前,她的第一份答卷是去年12月发布的、对标 DeepSeek-V3.2 的 MiMo-V2-Flash,那时距她正式宣布加入小米仅仅过去一个月。
颇具戏剧性的是,这次的新模型 MiMo-V2-Pro 与 MiMo-V2-Omni 的早期测试版曾在 OpenRouter 上匿名发布。因其API调用量多日登顶日榜,外界一度猜测这是否是DeepSeek即将发布的新模型。

雷军在微博上公布了成绩:Mimo-V2-Pro 在权威评测平台 Artificial Analysis 上位列全球第八;若按大模型品牌排名,则位列全球第五,超过了xAI的Grok。
他在微博中强调:“我们在AI领域上相对比较低调,实际进展可能比大家看到的要快很多。”这番表态,无疑显露了小米在AI领域的高筑野心。

一次原本低调的匿名测试,却因被外界“错认”而获得了意外的肯定。雷军的底气,很大程度上源自他麾下的一员AI干将——小米MiMo大模型负责人罗福莉。
小米布局AI并不算晚,但此前并未跻身第一梯队。去年12月,前DeepSeek核心成员、人称“天才少女”的罗福莉加入小米,被外界视作小米AI研发步入“正规军化”的关键标志。
对于此次新模型的发布,罗福莉本人在社交媒体上用了一个特别的形容:“我称之为悄无声息的伏击。”

她解释道,这并非团队事先策划的“伏击战术”,而是从Chat到Agent的范式转变来得太快,快到连团队自身都感到难以置信。但对于在AI战场上暂处追赶位置的小米而言,需要的正是这种一鸣惊人的能力与魄力。
而回顾罗福莉的成长轨迹,你会发现,她最擅长的,恰恰就是从落后到领先、最终完成一场“静默伏击”。
01 拒绝“天才少女”标签的奋斗者
“天才少女”是罗福莉最为人熟知的称号,但她本人却对此深感抵触。
这个标签始于2019年的一次“出圈”事件。当时,有人发现北京大学计算机系的硕士生罗福莉竟然拥有“八篇ACL论文”。ACL是自然语言处理领域的顶级国际会议,含金量极高。此事在知乎发酵,引发了铺天盖地的崇拜、赞许与质疑。
罗福莉亲自下场澄清,说明自己只向ACL投了两篇论文,其余只是部分参与了实验室同学的研究。多年后她再回忆此事,认为2019年正值AI论文爆发期,这是她被广泛关注的时代背景。
六年后,当传闻小米以“千万薪酬”招揽她时,罗福莉再次回到公众视野。人们梳理她的轨迹:北大硕士、“阿里星”身份进入阿里达摩院、加入DeepSeek并成为V2模型的关键开发者、如今被小米高薪挖走……这一切似乎更加坐实了“天才”的标签。
但罗福莉不喜欢。入职小米时,她发了一条朋友圈:“请互联网还我一片安安静静做事的氛围吧,我不是天才少女,只想安安静静做难而正确的事情。”

这不是自谦。罗福莉的优秀毋庸置疑,但她绝非不劳而获的“天才”。1995年出生于四川宜宾的她,小时候并非尖子生,甚至经常排名靠后。得益于父母非打压式的教育,她通过制定阶段性小目标,一步步“挪”成了优等生。
考入北京师范大学电子专业后,她转入计算机系,又一次面临排名垫底的窘境。在一个约50人的班级里,她一度进不了前三十;别人三分钟能解出的编码题,她可能需要三小时。但她的目标清晰:保研北大,而名额每年仅有三四个。
通过一年的奋起直追,她的成绩稳在了保研线之上。刚升大三,她就主动联系北大导师,成功进入北大语言计算实验室实习。在十个实习生竞争一个保研名额的激烈环境中,初来乍到的她又成了“垫底者”——同期的实习生多为北大本校生,她的专业基础薄弱,甚至连当时“人人都会”的Python都不会。
于是,新一轮的“蜗牛爬”开始了。她曾回忆,自己用七天入门Python,四个月后以第二作者身份发表了第一篇顶会论文。苦尽甘来,她最终拿到了那唯一的保研名额。
了解了这段经历,就不难理解她为何拒绝“天才少女”的标签。这个称呼无形中抹杀了她一路走来的艰辛努力,也忽视了她最大的优势:在逆境中追赶并超越的能力。
02 从DeepSeek到小米的进化之路
“落后了,没关系,追上去。”这样的罗福莉,与去年在AI领域蓄力追赶的小米,堪称天作之合。而在加入小米前,她已完成了一次关键的自我进化。
北大硕士毕业后,罗福莉没有选择读博,而是通过录取率据说不足1%的“阿里星”项目,进入了阿里达摩院。在那里,她主导开发了服务于跨境电商场景的多语言预训练模型VECO。她曾感慨“阿里一年,人间十年”,这段经历并非全是胜利,也包括挫败,例如早期参与千亿参数模型训练时,因数据清洗和框架效率问题,导致模型“臃肿而不聪明”。
ChatGPT的出现带来了转机。行业补上了关键一课,她也理清了此前踩过的坑。2022年,她加入了当时连官网都尚未搭建的幻方量化旗下团队——DeepSeek。在这里,她开始系统性地重新审视研究路径:如何精准扩展参数与数据?如何设计高效的训练架构?
她主导开发的DeepSeek-V2于2024年5月发布,凭借将推理成本降至每百万tokens仅1元人民币(约为GPT-4 Turbo的七十分之一)的突破,一度被誉为“AI界的拼多多”。到了2025年,当国内大厂纷纷掀起人才争夺战时,罗福莉已经完成了从学术研究到工业应用的扎实进化。
03 一场“静默伏击”能否带来长期战斗力?
小米入局AI的时间并不算晚。早在2023年8月,小米就发布了MiLM-6B模型;2024年6月发售的AI眼镜,也曾在京东旗舰店取得五日销量破万的成绩;若将视野放宽,小米在2021年就已布局具身智能。
但一个不争的事实是,小米在AI大模型领域尚未进入公认的第一梯队。2023年5月,小米曾公开表示“不会做OpenAI类的通用大模型”。然而到了2025年,雷军显然改变了主意。
去年,一场激烈的人才争夺战在国内大厂间展开。字节跳动、阿里巴巴等公司纷纷引入顶尖AI人才。雷军也果断出手,据传以重金从DeepSeek请来了罗福莉,这也让她再次成为舆论的焦点。
小米面临的AI局面是复杂的。它需要同时推进两类不同方向的AI:一类是以应用和交互为核心的数字智能;另一类则是面向真实物理场景的智能系统。前者更依赖模型能力与产品体验,后者则涉及感知、决策与复杂的工程落地。大多数公司通常聚焦于其中一条路径,而小米则需要并行探索两条,并思考它们之间的协同,这在国内公司中并不多见。
去年12月,在2025小米“人车家全生态”合作伙伴大会上,罗福莉作为第三位嘉宾登台演讲。那是她入职小米后的首次公开亮相。会上除了发布MiMo-V2-Flash,小米自研的MiMo系列大模型家族也完整呈现,涵盖推理、视觉推理、音频生成、端侧视觉语言及具身智能等多个方向。
罗福莉坦言自己有些紧张,但在台上却金句频出。她明确指出,下一代智能体系统不应只是一个“语言模拟器”,而应是一个真正理解并能与人类世界共存的智能体。在她看来,AI进化的下一个起点,必然是拥有一个能与物理世界交互的模型。

这意味着,AI不仅要能“看懂”画面,还要理解其背后的物理规律;不仅要能推理文本,更要理解世界的运作逻辑。这与李飞飞、杨立昆等顶尖学者所倡导的“世界模型”路径不谋而合。罗福莉也指出,这一点在业界并非共识。例如,OpenAI前首席科学家Ilya Sutskever就曾认为,仅通过文本学习,模型也能内化出对世界的抽象认知和推理能力,即单靠语言便可逼近通用智能。由此可见,罗福莉的AI蓝图极具野心。
她面临的挑战也随之升级。如果说之前的经历让她完成了从学术到工业的进化,那么在小米这样规模的企业担任MiMo大模型负责人,她还需要蹚过管理与协同这条新的河流。她领导的团队是大模型核心研发部门(Core),直属集团技术委员会。而模型能力的最终落地,需要面对手机、汽车、IoT等各条已有成熟团队和既定节奏的业务线。
回想小米十几年前首次尝试造芯,由于研发团队(松果电子)与手机业务团队协同不畅,最终成果有限。2021年小米重启造芯计划时,便直接将团队放在了手机部门之下。这一历史经验,也凸显了跨部门协同的重要性。
此次小米连发三款模型,仅仅是一个开始,模型的实际能力尚需在更广泛的应用场景中接受检验。罗福莉能否协助小米,像她个人多次完成的那样,实现一场从追赶者到引领者的“逆袭”,目前仍是未知数。
这场被罗福莉称为“悄无声息的伏击”,究竟是一次漂亮的亮相,还是能转化为小米在人工智能时代持续的战斗力?答案将交由时间和市场来书写。更多前沿技术动态与深度分析,欢迎访问云栈社区进行交流探讨。