罗福莉交上了在小米的第二份答卷。

3月19日,小米发布「面向Agent时代」的旗舰基座模型Xiaomi MiMo-V2-Pro,以及全模态基座模型Xiaomi MiMo-V2-Omni和语音合成模型Xiaomi MiMo-V2-TTS。

此前,罗福莉的第一份答卷,是去年12月小米发布的MiMo-V2-Flash,对标DeepSeek-V3.2。彼时,距离罗福莉刚正式宣布加入小米刚过去一个月。

颇具戏剧性的是,这次的新模型MiMo-V2-Pro、MiMo-V2-Omni的早期测试版在OpenRouter上匿名发布,API调用量多天登顶日榜,外界都在猜测是不是DeepSeek的新模型。

雷军发微博表示,Mimo-V2-Pro,在Artificial Analysis上位列全球第八,如果按照大模型品牌来看,位列全球第五,超过了xAI的Grok。

“我们在AI领域上相对比较低调,实际进展可能比大家看到的要快很多。”

原本是低调的匿名测试,却反而因为外界的“错认”得到了肯定。从雷军的表态不难看出,小米在AI领域的野心高筑。

而雷军的底气,大概很大程度上来自于如今小米AI的一员干将——小米MiMo大模型负责人罗福莉。

小米在AI领域发力很早,但并未跻身第一梯队。去年12月,前DeepSeek核心成员、人称“天才少女”的罗福莉加入小米,被外界视为小米AI研发“正规军化”的里程碑。

此次模型发布,罗福莉在社交媒体上发文,形容新模型的发布:“我称之为悄无声息的伏击。”

罗福莉解释,这并非是团队事先策划了“伏击”,而是从 Chat 到 Agent 的范式转变来得太快,快到连团队自己都有点难以置信。

但即便是刻意为之的“伏击”又如何?在AI战场上落后的小米,需要的正是一鸣惊人的能力与勇气。

更妙的是,罗福莉最擅长的,正是从落后到拔尖、悄无声息的伏击。

01

低起点的“天才少女”

罗福莉最为人所熟知的称号是“天才少女”,她自己却并不认可。

“天才少女”的称号始于2019年罗福莉第一次火出圈。

当时有人发现,北京大学计算机系的硕士研究生罗福莉,居然有“八篇ACL论文”。ACL是自然语言处理(NLP)领域的顶级国际会议,含金量极高,被誉为“NLP界奥斯卡”。这件事在知乎上发酵,崇拜、赞许、质疑的声音同时涌来。

罗福莉亲自在知乎发文解释,称自己向ACL投了两篇论文,其他只是“部分参与了实验室同学的研究”。之后罗福莉还曾回忆那段往事,认为2019年正逢AI论文集中爆发的时代,这也是她被关注到的一个背景。

六年后,罗福莉重新回到公众视野,就是传闻小米“千万薪酬”招她加入之时。

人们回溯罗福莉从北大硕士毕业之后的轨迹——作为“阿里星”的身份直通阿里达摩院,然后加入DeepSeek,是DeepSeek-V2的关键开发者,如今又被小米高薪挖走,更加深了对她“天才少女”标签的认同。

但罗福莉并不喜欢这个称号。

加入小米,罗福莉发了个朋友圈:“请互联网还我一片安安静静做事的氛围吧,我不是天才少女,只想安安静静做难而正确的事情。”

罗福莉并非自谦,她绝对优秀,但绝非“天才”。

罗福莉1995年出生于四川宜宾,小时候并非尖子生,甚至经常排名靠后。好在父母不是打压式教育,而是陪着罗福莉制定阶段性的小目标,一步一步往上“挪”,真就逐渐成为了尖子生。

后来,罗福莉一心想去一线城市开拓视野,考入北京师范大学,读电子专业,又转专业进入了计算机系。在这里,罗福莉又要重走一遍小时候的路,她又排名靠后了。

五十个人左右的班级,罗福莉连前三十都进不去。编码题别人三分钟能做出来,她得用三个小时。

但是罗福莉当时已经盯上了保研北大的名额,每年只选三四个。用了一年的时间,罗福莉的成绩稳在了保研线以上,又盯上了北大计算机系。

刚升到大三,罗福莉就开始试图联系北大的导师,成功进入了北大语言计算实验室实习。十个实习生,只有一个保研到北大计算机系的名额。

而罗福莉,又垫底了。

同期的其他实习生都是北大本校的,她的专业基础根本不够用,连“人人都会”的通用编程语言Python都不会。

于是又是艰苦的“蜗牛爬”,罗福莉后来回忆那段日子,七天入门Python,四个月后以二作发了第一篇顶会论文,苦是真苦,值也是真值——她真的拿到了那唯一一个保研名额。

了解了罗福莉的这些经历,就不难理解她对“天才少女”的拒绝。被称作天才,实际上也是被抹杀了一路的努力,也抹杀了她最大的优势。

02

从DeepSeek到小米

落后了,没关系,追上去。这样的罗福莉,和去年的小米是天作之合。加入小米之前,罗福莉还完成了一轮自我进化。

从北大研究生毕业之后,罗福莉没有继续读博,而是进入了阿里达摩院。

专门针对顶尖毕业生的“阿里星”项目,江湖传闻录取率不到1%,罗福莉就是其中之一。

在阿里达摩院,罗福莉主导开发了多语言预训练模型VECO,这个模型直接服务于跨境电商场景,重要性不言而喻。

罗福莉曾感慨“阿里一年,人间十年”,在阿里达摩院并不全是胜利和喜悦,也有挫败和落寞。比如她很早就参与过千亿参数模型训练,但第一次做1750亿参数规模的模型,数据清洗不到位、框架效率低下,最后喂出来的模型很大,却臃肿不堪,并不“聪明”。

转机出现在 ChatGPT 之后。行业补完了那一课,她也把之前踩过的坑一一理清。

2022年,罗福莉加入了当时连官网都没有的、DeepSeek的母公司幻方量化。在DeepSeek,她开始重新审视科学的研究路径:如何精准地Scaling参数与数据?如何设计高效的训练架构?

罗福莉主导开发DeepSeek-V2,2024年5月发布,将推理成本降低至每百万tokens仅1元人民币,是GPT-4 Turbo的七十分之一,一度被称为“AI界的拼多多”。

等到2025年,国内大厂掀起人才大战的时候,罗福莉已经完成了从学术到工业的进化。

03

悄无声息的伏击

小米入局AI并不算晚,早在2023年8月,小米就曾发布MiLM-6B模型。去年6月发售的AI眼镜,也曾在京东旗舰店打出五日销量破万的好成绩。如果泛化到更广阔的场景,小米在2021年就布局具身智能。

但是小米尚未跻身第一梯队。

2023年5月,小米公开发声“不会做OpenAI类的通用大模型”,但是时间到了2025年,雷军显然变了主意。

去年,一波人才抢夺战在大厂打响。谷歌DeepMind原研究副总裁吴永辉出任字节AI研究部门Seed新负责人,字节还请来了谷歌原VideoPoet项目负责人蒋路,零一万物原预训练负责人黄文灏、阿里通义大模型原技术负责人周畅。

而雷军也出手,重金从DeepSeek请来了罗福莉。传闻中的“千亿薪酬”,也让罗福莉再一次成为舆论争议的焦点。

小米的情况是复杂的。

难点在于要同时推进两类不同方向的AI:一类是以应用和交互为核心的数字智能,另一类是面向真实场景的智能系统。前者更依赖模型能力与产品体验,后者则涉及感知、决策与工程落地,技术路径差异明显。

大多数公司只聚焦其中一条,而小米需要同时探索两条路径,并思考它们之间的协同方式。国内需要这样思考的公司不多。

去年12月,2025小米“人车家全生态”合作伙伴大会上,罗福莉作为第三位嘉宾上台演讲。

当天除了发布MiMo-V2-Flash之外,小米自研MiMo系列大模型家族赫然呈现:推理大模型、视觉推理大模型、原生端到端音频生成模型、端侧视觉语言大模型、具身大模型。

罗福莉直言有一些紧张,但是却在台上金句频出。

罗福莉认为,下一代智能体系统不是一个“语言模拟器”,而是一个真正理解人类世界,并与之共存的“智能体”。

在她看来,AI进化的下个起点,一定是有一个能跟物理世界交互的模型。

AI不仅要看懂画面,还要理解背后的物理规律;AI不仅要推理文本,而是理解世界的运作逻辑。

这不禁让人想到李飞飞、杨立昆等顶尖学者所选择的“世界模型”的路径。

罗福莉说,这一点并非共识。

比如OpenAI的联创之一、前首席科学家伊利亚·苏茨克维(Ilya Sutskever)就认为,通过文本学习,模型也能内化出对世界的抽象认知和推理能力。换句话说,单靠语言就可以逼近通用智能。

罗福莉的野心,可见一斑。

罗福莉面临的挑战也更大,如果说之前的经历让她完成了从学术到工业应用的进化,那么在小米如此规模的企业担任MiMo大模型负责人,她势必还需要蹚过管理与协同的河。

她负责的团队是大模型Core,直接归属于小米集团技术委员会管理。真正要落地,得面对的是各条已经跑起来的业务线——无论是终端,还是自动驾驶,背后都有自己成熟的研发团队和既定节奏。

遥想十几年前,小米第一次尝试造芯,全资子公司松果电子研发,手机团队并不买账。2021年小米重启造芯计划的时候,就干脆放在了手机部之下。

小米连发三个模型,还只是个开始,模型能力还需进一步检验。罗福莉能否最终协助小米,如同她自己在人生中完成很多次的那样,完成一场从落后到顶峰的“逆袭”,尚未可知。

这场悄无声息的伏击,能不能从一次漂亮的出手,变成长期的战斗力?

参考资料:

1、北大人:《对话北大校友罗福莉:在自由的风里,做难而正确的事》

2、最人物:《年薪千万,天才少女求放过》

3、智东西:《金句媲美雷军!罗福莉首次站台小米演讲,揭秘MiMo大模型和背后团队》

4、腾讯科技:《“雷军的AI秘密武器”罗福莉首秀:详解小米AGI之路》

5、新皮层NewNewThing:《入职小米后,罗福莉交卷了|大公司》

本文转自:凤凰网科技

原文地址: https://tech.ifeng.com/c/8rc7LYhtxir