小米罗福莉Fable_5:阶段性成果深度解析
智源大会的圆桌论坛,素来是窥探国内AI风向的绝佳窗口。最近落幕的第八届大会上,一场由中国顶尖研究者和产业代表参与的巅峰对话,再次将目光聚焦于技术最前沿。
小米集团MiMo负责人罗福莉,清华大学教授、生数科技创始人朱军,面壁智能联合创始人兼首席科学家刘知远,以及南洋理工大学的安波教授,围绕着Claude Fable 5、AI自进化、世界模型等炙手可热的话题,展开了一场近五十分钟的深度思想碰撞。
▲智源大会《重构世界——中国大模型巅峰对话》环节
针对引发轰动的Claude Fable 5,罗福莉将其实力归结为“Scaling(扩展)”策略在多维度持续发力的必然结果——更大的预训练规模、更巨量的数据,以及更深入的强化学习。她坦言,连身处一线的从业者,都常为大模型与AGI的跃进速度感到震撼。
朱军则从应用角度指出,Agent和AI Coding消耗大量Token曾是痛点,而新一代模型显著降低了任务中的Token成本,这一点至关重要,意味着更高效、更经济的智能应用成为可能。
刘知远点破了Anthropic估值反超OpenAI背后的逻辑:他们成功押注了“代码”这一数字世界的核心生产力工具,并形成了高效的数据闭环。他认为,智能革命的本质在于用AI替代重复性脑力劳动,而这场变革的浪潮,其速度将远超历史上的工业革命。
安波教授谈及AI自进化时,则提出了一个关键前提:环境不能封闭。尤其在AI能力尚弱时,闭门造车式的数据飞轮很难真正运转,必须从开放世界和人类反馈中汲取养分。
对话尾声,四位专家也给身处变革时代的年轻人留下了寄语:罗福莉强调保持好奇心并深度使用大模型;刘知远总结为“敢为人先、长期坚持、持续自我革新”;朱军建议积极拥抱时代,善用AI;安波则认为选对赛道、做重要的事,比一纸学位更为关键。
01.四位大咖最新关注点:自进化、世界模型、智能密度与Harness
主持本场对话的智源研究院院长王仲远开宗明义,将主题定为“重构世界”。他认为,AI正在从改造行业的工具,跃升为重构世界的底层力量。无论是AI创造AI的可能性,还是智能向物理世界的延伸,都预示着一场深刻的范式转移。
在简述环节,四位嘉宾各自亮出了近期最关注的技术焦点:
罗福莉的关注点在于“自进化”(Self Improvement),特别是自动化研究(Auto Research)领域。在她看来,当前AI发展过于绚烂,而自进化是探索能力边界的关键路径。
朱军的研究重心是“通用世界模型”。他近期最关注以视频为原生形态的模型架构,以及如何通过这类模型打通对世界的理解、预测和行动能力。
刘知远提出了“智能密度定律”的概念。其团队的目标是不断提升模型的智能密度,让模型能力更强、体积更小,最终赋能千行百业的智能终端。
安波教授则聚焦于“智能体驾驭”(Agent Harness)。他的问题是,在基础模型能力既定的前提下,如何通过更好的机制设计,激发出更强的推理与执行能力。
02.如何看待Claude Fable 5?本质是Scaling持续推进的结果
对话自然从刚刚发布的Claude Fable 5切入。王仲远提到,该模型展示出一天迁移5000万行代码库的惊人能力,并抛出了核心问题:这是量变的积累,还是已接近质变临界点?
罗福莉的观点非常明确:Fable 5仍是Scaling路径上的阶段性成果。她分析认为,其能力跃升源于三个维度的持续扩展:预训练模型规模可能已达顶尖开源模型的数倍;在推理时扩展(Test-Time Scaling)和强化学习上投入了海量算力;训练数据本身发生了质变,从互联网文本转向人机协作产生的合成数据,数据规模迈上了新量级。因此,这更像是一个必然的中间阶段,而非终点。
▲小米集团MiMo负责人罗福莉
王仲远追问道,模型能力提升是线性还是指数增长?罗福莉认为这很难用单一曲线描述,因为能力的提升往往是“涌现式”的,在不同阶段、不同路径上都能观察到类似现象。
朱军从旁观者和视频模型研究者的角度补充道,模型、数据、算力规模的扩大,确实仍在带来显著的性能提升。他特别赞同Fable 5降低企业任务Token消耗的方向。“模型应该依靠更高层智能去组织和推理,而非单纯堆砌Token,这才是释放大模型真正价值的关键。”
至于视频与世界模型的Scaling边界,朱军判断潜力依然巨大,可能才刚刚开始,未来在架构优化和数据高效利用上还有很长的路要走。
▲清华大学计算机系教授、生数科技创始人朱军
刘知远则从三个层面给出了思考。首先,Fable 5的成功印证了“可持续的Scaling”离不开一条强劲的数据飞轮闭环,尤其是在代码这类易于收集反馈的领域。其次,代码作为数字世界的核心生产力,其模型能力的碘伏性提升,将波及工业软件、网络安全等诸多行业,甚至可能为突破某些技术封锁提供全新思路。最后,也是最重要的启示在于,Anthropic的成功在于找到了一个能快速形成数据闭环的垂直领域(代码)。这提示业界,应主动在各个专业领域寻找并构建类似的数据闭环,从而加速AI的行业落地。
安波教授从智能体研究的实践出发,指出模型编码能力的增强对解决特定类别的问题至关重要。但他也提醒,并非所有问题都能通过编码解决,智能体的未来潜力,更可能在于深入那些真正重要的垂直工业场景。
03.AI自进化不等于闭门造车,未来世界模型一定会走向通用
当话题转向更富科幻色彩的“AI自进化”与“AI创造AI”时,现场的观点呈现出精妙的层次。
罗福莉结合自己的观察,描绘了一幅清晰的演进图景。她认为,上一代顶尖模型强于“执行”,而如今已外延至解决抽象问题。以完整科研流程为例,大模型已能在设计实验、验证指标、规划流程等环节表现出色,与顶尖研究员的主要差距集中在“提出假设”和“研究品味”这种更高阶的认知层面。而这一差距,正被更强的模型叠加递归自改进(RSI)系统不断抹平。
刘知远则从历史维度进行了一场精彩类比。他将智能革命对标工业革命:后者用机器替代重复体力劳动,其终极形态是“机器制造机器”;前者则是用AI替代重复脑力劳动,其高级标志必然是“AI制造AI”。令人震撼的是,从大模型出现到触及这一标志,可能仅需寥寥数年,其变革速度远超历史经验。
▲面壁智能联合创始人兼首席科学家、清华大学教授刘知远
但他也强调,这个过程的“最外层驱动力依然是人”。人类决定制造什么样的AI、用于何种目的,其主体性和价值观是无可替代的核心。
安波教授对此表达了审慎的认同。他相信AI可以改进AI,但重点在于方法。尤其在AI能力尚弱时,有效的自演化必须发生在开放环境中,依靠来自外部(如人类反馈)的额外信息输入。“如果完全封闭地搞数据飞轮,很难行得通。”对于当前热议的AI意识问题,他认为为时尚早。
▲南洋理工大学校长讲席教授、人工智能交叉研究院院长安波
讨论随后扩展到“世界模型”。朱军指出,物理世界是一个完全的开环系统,远比固定数据集复杂。在这样的环境中,自演化要求模型具备在线学习和处理多维度、非清晰目标的能力。他展望的未来路径是:先构建一个通用的基础世界模型(达到可用水平),再在此基座上针对具体场景激活和提升。最终,世界模型一定会走向通用化,如同Transformer成为NLP的通用基座一样。
04.世界模型效率仍有提升空间,长上下文成难点
“重构世界”有两条主要路径:一是从数字世界(如AI Coding)出发,由内而外;二是从物理世界(世界模型)出发,由外而内。哪条路更快、更根本?
罗福莉认为,目前语言模型路径走得更快,因为我们能更好地在数字世界复现智能诞生的环境,并设计激励系统。而世界模型仍处早期,一个关键瓶颈在于缺乏能够在长上下文场景下保持高效的世界模拟器。一旦这个高效的“重构引擎”出现,其上同样可以叠加智能体系统进行扩展。两条路径在底层逻辑上未来会互通。
朱军对此表示赞同,并进一步阐释了世界模型的核心能力要求:理解状态、预测想象、规划执行。视频数据是构建世界模型最丰富的养分来源。当前挑战看似是渲染像素带来的效率问题,但对机器而言,若只需内部规划并输出动作指令,效率仍有巨大优化空间。当下的首要任务,仍是全力推高智能的上限。
05.给年轻人的建议:保持好奇心,比焦虑更重要
面对技术爆炸性增长带来的普遍焦虑,四位深耕一线的专家给年轻一代的建议,反而显得沉着而务实。
罗福莉的建议源于切身感受:保持探索欲和好奇心,并深度使用最新的大模型。在大量试错中形成的判断力与“品味”,将是人与AI协作中最具价值的优势。
朱军在与本科生的接触中深感共鸣。他承认焦虑普遍存在,但更重要的是“找到自己的根基”。打造扎实的基础,并积极拥抱AI作为学习伙伴,才能在变化中站稳脚跟。他宽慰道:“如果你感到焦虑,也不用太焦虑,因为你身边的人可能比你更焦虑。”
刘知远给出了三点凝练的提议:一是敢为人先,在无人区寻找创新;二是长期坚持,能承受伴随独特选择而来的质疑;三是持续自我革新,避免成为依赖过去成功的“既得利益者”。
安波的观点则更为锐利。他认为,在这个时代,“选对赛道、做重要的事”远比一纸学位重要。一个在顶尖机构深耕三年的本科生,其成长可能超过按部就班读博。关键在于你会什么、能创造什么。此外,找到志同道合的伙伴共同学习、碰撞,是跟上时代飞速步伐的必需。
最终,对话回归到一个共识:这个世界变化太快,焦虑是所有人的共同体验。或许未来回望,重要的不是某个具体模型,而是在这样的巅峰对话中,人类对智能本质与未来共同体的持续探问与思考。




