智源大会前瞻:200+AI专家热议世界模型与具身智能

2026-06-14阅读 0热度 0
世界模型
2026智源大会刚刚闭幕,两天议程信息高度浓缩,观点交锋激烈。从2015年图灵奖得主Whitfield Diffie到2024年得主Andrew Barto,从王坚、黄铁军到罗福莉、陈博远等新生代面孔,这场大会几乎汇聚了AI领域最核心的思想者与实干家。 若将大会精华提炼为五个关键洞察,大致如下: 1. **Agent正从“概念验证”迈向“体系化落地”**。图灵奖得主Diffie专门探讨了AI Agent的安全议题,甚至预言2050年机器智能将主导世界。而王坚则明确表示“不相信AI会替代人类”。圆桌讨论中,安波强调了Agent Harness机制的关键作用。智源直接发布了四款智能体,其中心脏疾病诊断智能体已达到安贞医院顶尖医生水准,自主研究智能体AREX的性能可匹敌万亿参数旗舰模型。 2. **世界模型成为下一代技术赛道的制高点**。智源首次公开了正在训练中的世界基座模型“悟界·Physis-v0.1”,并梳理了四条技术路线。清华大学的朱军认为,视频原生模型的Scale Up路径“才刚刚启动”。王坚指出,一旦AI真正理解科学数据,科研范式将迎来根本性变革。 3. **基础研究与产业创新形成正向协同循环**。面壁智能的刘知远分析了Anthropic估值反超OpenAI的逻辑,核心在于专业领域的数据闭环。智源开源了200余个模型,下载量超10亿次,其FlagOS平台适配32款芯片。从“悟道”到智谱、面壁、银河通用的孵化路径已跑通,海淀区配套90亿元产业资金和“模型券”政策,加速推动这一闭环。 4. **90后成为技术主力,00后开始涌入创新一线**。95后小米MiMo负责人罗福莉、22岁智源行为世界模型创新中心负责人陈博远站上C位。陈博远分析Fable 5时认为,其本质仍是Scaling的持续推进。NeoCognition联合创始人谷雨分享了AI自进化的探索。00后香港大学博士生任旭滨带来了龙虾热潮、nanobot和AI开源方法论的独特见解。大会甚至首次设立初中生AI展示环节,05后、10后登台亮相。 5. **从LLM到世界模型时代,中关村引领技术与人才的涌现**。在大模型产业论坛上,一批走向世界的本土大模型企业回归这片热土,深耕世界模型的年轻学者自信发声。这背后,是中关村通过扶持研发机构、配套产业基金、提供算力补贴和青年安居保障等举措,让全球年轻人才愿意来、留得下、出成果。 当全球AI竞赛进入深水区,一个关键问题摆在眼前:**下一轮突破将从哪里诞生?** 答案或许就藏在这场刚刚落幕的大会里。

一、全球视野下的AI Agent浪潮:海内外院士的观点交锋

大会首日的播客对话环节,中国工程院院士、阿里云创始人王坚与智源研究院理事长黄铁军,展开了一场关于AI与人类未来的深度对话。 王坚的观点令人印象深刻:“我坚定不相信AI会替代人类。狗的鼻子比人灵敏很多,但我们从来不觉得这对人有什么威胁。”他认为,今天讨论大模型时提到的“幻觉”等概念,原本都是用来形容人的。“我是一个无药可救的乐观主义者,我一直相信人类自己创造的问题,人类一定会解决。” 谈及中美AI的差距,王坚的判断是:“中国和美国在这个领域看到的是同一片大海。如果六七年以前,我担心的就是我们看到的是个游泳池,别人看到的是大海。尽管远处看都是蓝蓝的,但走近看才知道不是同一个天地。那基本上我今天还是可以说,我们大家看到的是同一片天地。”这个判断背后,是王坚对“框架”的深刻思考。他透露,自己思考AI问题始终放在动物智能、人类智能和机器智能的框架下,“你要给自己一个可以超出现有框架的思考框架”。 黄铁军则用“父母与孩子”来比喻人与AI的共存关系:“AI是孩子,有冲突但不可分离。AI可以去宇宙之外,我们很难做到,我们通过智能这个桥梁连接。”他特别强调,智能革命的核心在于用AI替代机械的、重复的脑力劳动,而“AI制造AI”一定是技术发展到高级状态的标志。 两位图灵奖得主的演讲同样引发了全场热议。公钥密码学之父、2015年图灵奖得主Whitfield Diffie在题为“Security For AI Agents, Security Against AI Agents”的演讲中给出了一个惊人预测:“到2050年,机器智能将超越人类,成为世界运行的主宰。”但他强调,这并非一场人与机器的战争,而是一个简单的机制:“人们主动提出为我们做事,我们喜欢有人替我们做事,我们就说‘好,帮我们做’。到某个时候,我们会环顾四周,发现机器在做所有事情。”关于AI安全,Diffie批评了当前依赖反馈控制的方法效果不佳,主张形式化方法才是未来,即先明确形式化规范、再编写程序、最后数学证明程序符合规范。他乐观地认为,未来AI将成为完成这些证明的工具。 2024年新晋图灵奖得主、马萨诸塞大学阿默斯特分校荣誉退休教授Andrew Barto则强调,强化学习本质上是在解决控制、搜索与记忆之间的协同问题,而这恰恰也是未来智能体系统的重要基础。关于RL是否是通往AGI的道路,Barto认为RL具备其他学习形式没有的能力,但反之亦然——RL需要大量试错,它可能是AGI的必要组成部分,但绝非全部。针对“RL无法建立新能力、只会缩小行为分布”的质疑,他明确反驳:系统必须探索,这意味着尝试那些并非由已有行为暗示的动作。尤其在顺序决策中,即便单步后果已知,新的动作组合仍可能产生全新结果,因此RL确实能发现新行为。 对于博士生研究方向,他建议了两个前沿领域:一是多智能体RL,神经系统本身就是大量RL智能体的相互作用,该领域研究不足但极具价值;二是神经科学与RL的交叉,借助RL概念解析神经系统,可获得突破性认知。他同时警示了奖励信号设计的根本挑战:设定错误的目标函数会引发“反常实例化”,必须为RL智能体设置充分“护栏”并进行广泛实验验证。 国内外泰斗的同时亮相,凸显了智源大会在全球AI学术界的号召力,这正是中关村长期深耕基础研究的底气。如果说十年前中关村是中国互联网技术讨论的中心,那么今天,它正在成为全球AI前沿思想的重要交汇点。

二、国产大模型前沿对话:90后00后站上C位

智源大会开幕式上,一场由智源研究院院长王仲远主持的圆桌对话成为全场焦点。小米集团MiMo负责人罗福莉、清华大学教授兼生数科技创始人朱军、面壁智能联合创始人兼首席科学家刘知远、南洋理工大学教授安波四位专家展开了近50分钟的深度交流。 引发业界热议的Claude Fable 5成为讨论热点。罗福莉抛出了她的观点:“Fable5目前展现出来的能力,本质上仍然是Scaling持续推进后的自然结果。”她分析,这背后是预训练规模、数据规模以及强化学习三个维度的持续扩展,“过去互联网文本数据的Unique Token规模大约在40T到80T之间,而现在的数据规模已经迈上了新的台阶。”作为小米MiMo团队负责人,罗福莉的观察具有产业一线的敏锐度。她对当下AI的感受是:“大模型和AGI的发展速度实在太快了,快到连我们这些从业者都会感到震撼。” 朱军则从Token经济角度给出了判断:“过去使用Agent或AI Coding解决问题时,往往会消耗大量Token。新版本模型在任务中的Token消耗下降,这是一个正确方向。”他同时透露,生数科技正在视频原生模型架构上持续探索,认为世界模型的Scale Up路径“刚刚开始,后边还有很大一块要去探索的地方”。 刘知远点明了Anthropic成功甚至估值反超OpenAI的原因:“Anthropic之所以成功,是找到了代码这样一个非常重要的垂直方向。”他进而提出,未来在专业领域里形成数据闭环,一定可以加速AI应用,“智能革命其实就是要用AI来替代人的机械的、重复的脑力劳动”。对于AI自进化,安波提出了一个重要前提:“在AI能力较弱的时候,AI自进化如果要行得通,一个重要的前提是环境不能完全封闭,如果完全封闭地搞数据飞轮,很难行得通。” 值得注意的是,这些站在中国大模型最前沿的掌门人与核心干将,呈现出越来越明显的年轻化趋势。小米MiMo负责人罗福莉是95后科研带头人,其他几位也大多是80后。 本届智源大会不仅90后创业者、科研带头人聚集,还专门设置了“AI原生教育论坛”和面向青少年的开源技术教程活动,并首次出现了“初中生AI创新展示”环节,让一群05后、10后带着自己的Agent项目登台展示。 在AI自进化分论坛专场,90后创业者、NeoCognition联合创始人谷雨主张像人一样构建自己的“世界模型”。他们构建了一种“自我学习型AI智能体”,不再依赖静态的训练数据或重复的人工提示,而是在执行任务的过程中,持续观察、理解并适应所处的环境,逐步建立起一个“微观世界模型”。 在InnoVibe共创场特色活动,22岁的北京大学本科生陈博远带来了题为《Physis-v0.1:预测下一个物理状态,迈向通用世界基座模型》的主题演讲。别看他年轻,他已经是智源研究院行为世界模型创新中心的负责人、逆矩阵科技Physis的创始人。他在现场讲解了智源正在研发当中的世界基座模型——悟界·Physis-v0.1。该模型具备AI底层四大典型核心能力:物理一致性、动作灵活性、长程可推演、通用泛化性。通过为理想的空间建模,能够真正实现全模态的输入,以及下一步物理状态的预测。该模型目前还在训练中,将在未来几个月开源。 同是00后的香港大学博士生任旭滨及其所在团队,对龙虾热潮、nanobot、CLI与AI开源方法论有独到见解。针对GUI Agent交互慢、不准、Token高及代码臃肿等痛点,他们用4000行代码打造了轻量级AI助手nanobot,并推出CLI-Anything为Agent提供原生命令行接口、替代笨重GUI。他们以开源共建、干中学快速迭代、不盲从热点的干劲令人印象深刻。 北京中关村已经把舞台交给了下一代。这种年轻化、去仪式感的务实风格,正在成为全国AI会议的新风向标。这种代际更替速度,本身就是创新活力的重要体现。

三、新成果集中爆发:智源连甩多项“王炸”研究进展

人才与思想最终都要落到技术成果上。在大会开幕演讲中,智源研究院院长王仲远系统分享了近一年来的多项重磅研究成果,覆盖基座大模型、智能体和基础软硬件生态三大板块。 基座大模型方面,智源研发的原生多模态大模型悟界·Emu3.5已于2025年10月发布,其通过Next-Token Prediction实现了文本、图像、视频的统一学习。前代模型悟界·Emu3在今年1月登上Nature正刊,成为国内多模态大模型方向的第一篇该刊正刊论文。 更令人兴奋的是,智源将这一技术范式扩展到了神经科学领域,正式发布了神经科学模型悟界·Brainμ1.0,实现了将脑信号与文字、图像、声音互相转换。同时,智源还发布了全球最大最全的AI-Ready神经科学领域数据集,以及全球最大的AI-Ready神经科学数据平台BrainToken。此外,AI药物发现模型悟界·OpenComplex2.5也正式亮相,通过单一流程覆盖口袋识别、反向筛选、结构预测、形成力预测四大制药关键步骤,在多个benchmark上超越了传统物理方法和其它AI模型。世界模型方向,智源推出了通用世界基座模型悟界·Physis-v0.1以及以下一个物理状态预测为核心的具身大脑悟界·RoboBrain Orca。 智能体方面,智源发布了四款智能体产品,展现出从通用能力到垂直场景的全面布局。面向心脏疾病的辅助诊断智能体与安贞医院共同研发,其诊断精确度能够达到安贞医院顶尖心血管医生的水平;面向科学发现的自主研究智能体AREX覆盖了从信息调研、方案设计到实验探究、报告撰写的完整科研链路,在权威基准测试上显著超越同等参数开源模型,比肩万亿参数级别旗舰模型;智源大会专属听会智能体SoulAgent为参会者提供一站式服务;有害蛋白识别智能体则首次通过红队实验验证了智能体辅助筛查有害蛋白的能力。 在基础软硬件生态方面,众智FlagOS已更新至2.1版本,适配18家芯片厂商的32款芯片,成为目前全球适配芯片品类最多的计算系统,可支撑90%以上主流开源模型部署。 从基础研究到产业落地的创新链条正在中关村清晰成型。从清华、北大等高校,到智源研究院等新型研发机构,再到小米、字节、生数科技等企业,中关村正在形成一条完整的创新链条。 这背后离不开当地持续加码的产业和人才政策,让全球顶尖年轻人才愿意来、留得下、出成果。 产业方面,离不开北京及海淀区相关产业政策的大力支持。2026年3月,北京市海淀区在2026经济社会高质量发展大会上发布《海淀区现代化产业体系“1+X+1”建设布局》,提出以AI驱动五大战略性新兴产业与三大未来产业。同时发布《2026年海淀区打造最具投资价值之城实施方案》及政策支撑体系,实施和谋划36项支持政策,其中7项为新政,包括总规模80亿元的中关村科学城科技成长四期基金、20亿元的中关村科学城成果转化基金、海淀区关于支持“海青安居”的若干措施等系列支撑政策。2026年,海淀还将统筹安排不低于90亿元的产业创新专项资金,助力企业发展壮大。 面向Agent产业化落地,当“一人公司”(OPC)流行起来,北京市海淀区还发布了《海淀区关于全面打造OPC创业生态的若干措施》,推出OPC八项举措,其中“模型券”提供50%折扣、年补最高200万元,模型券总规模达1亿元。 人才政策方面,应届毕业生可申领每月1000元安居补贴、最长2年,北部四镇再加500元,不限户籍、线上办理。更早之前,中关村AI北纬社区的“Token Camp人工智能OPC加速营计划”已启动,面向AI原生团队与高校成果转化团队提供免费Token与算力……这些都体现了中关村对全球青年人才的开放姿态。 2025年,北京AI产业规模突破4500亿元,核心企业超2500家,占全国三成。已备案大模型212款,AI 2000入选学者148人,均居全国首位。北京已成为培育全球AI创新策源和产业生态的优质沃土。

结语:不拼红毯拼少年,在中关村看到中国AI创新活力

2026年智源大会像一扇窗口,让外界看到中国AI创新体系正在如何成长。 图灵奖得主与产业领袖讨论Agent未来,年轻科学家成为舞台中央的主角,90后甚至10后开发者开始展示自己的创新成果。这些看似分散的场景指向一个趋势:中关村正在同时扮演技术策源地、思想发源地和人才孵化器的角色。 从王坚“中美看到同一片大海”的判断,到罗福莉等年轻一代的产业洞察;从智源10项重磅成果的集中爆发,到模型券、安居补贴等政策的精准落地;从初中生AI项目登台展示,到90后、00后站上技术C位……这背后是一套完整的创新生态在运转。 在这个生态里,基础研究被尊重,产业转化有通道,年轻人被赋予舞台,创业者获得支撑。这种务实的创新文化,或许正是中关村乃至中国AI最宝贵的财富。 在中关村,从大语言模型到世界模型,从基础研究到产业落地,从顶尖科学家到下一代开发者,这种持续不断的新思想、新技术、新人才涌现,正是中国AI创新最具生命力的地方。而这,也是2026智源大会留给外界最重要的观察。
免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策