腾讯混元团队迎来新专家:前阿里通义视觉负责人薄列峰深度解析
原阿里通义实验室应用视觉团队负责人薄列峰,已正式确认加入腾讯混元大模型团队,直接向腾讯副总裁、混元项目负责人蒋杰汇报。这一消息为今年上半年关于其去向的猜测画上了句号。
今年4月底薄列峰从阿里离任时,业内便有传闻称其已加盟某大型互联网公司,负责多模态模型工作。如今传闻落地,其新东家正是腾讯混元。
从学术到工业界:薄列峰的AI之路
薄列峰的履历,勾勒出一条顶尖AI科学家的典型成长路径。他于2002年本科毕业于西安电子科技大学,2007年于该校智能信息处理研究所获得博士学位。此后赴美,先后在芝加哥大学丰田技术研究所和华盛顿大学从事博士后研究,聚焦机器学习、计算机视觉及人机自然语言处理交叉领域。他长期活跃于学术前沿,曾担任NeurIPS、CVPR、AAAI等顶级AI会议的程序委员会成员。
2013年,薄列峰进入工业界,加入亚马逊西雅图总部担任首席科学家。作为Amazon Go“无人便利店”项目的早期核心成员,他深度参与了第二代算法系统的开发,推动了计算机视觉与传感器技术的融合,将“即拿即走”的购物体验从概念变为现实。
2017年初,薄列峰回国加入京东数科(现京东科技),出任AI实验室首席科学家。2022年,他转投阿里巴巴,先是接替谭平领导达摩院XR实验室,随后调至通义实验室,主导应用视觉方向,成为阿里在图像与视频AIGC(生成式AI)领域的关键技术负责人。
在阿里的关键成果:从“全民舞王”到EMO
在阿里期间,薄列峰带领团队推出了一系列引发广泛关注的生成式AI应用。其中,支撑“全民舞王”功能的人体动作生成框架Animate Anyone、虚拟换装模型Outfit Anyone,以及基于语音驱动的人像生成系统EMO(Emote Portrait Alive),均是其团队的代表作。
这些技术已陆续集成至通义千问App,并被业界视为阿里应对Sora等竞争对手的关键技术储备。在2024年中国生成式AI大会上,人物动作生成、虚拟换装、数字替身与唱演生成,正是阿里展示的核心能力。
混元的“人才引力”:不止薄列峰一人
薄列峰的加盟并非孤例。近一年来,腾讯混元展现出强大的人才吸引力。
一个更早且成建制的案例是,微软开源大模型团队WizardLM的核心成员几乎全员加入。其中,项目负责人徐灿(Can Xu)于2025年5月在社交平台X上正式宣布加入腾讯,联合发起人郑开(Kai Zheng)也同期确认入职。团队另一位核心成员孙清峰(Qingfeng Sun)则更早,于2024年12月便已加入混元。
徐灿自2017年加入微软,长期专注于自然语言处理,深度参与了微软小冰、Phi-3等多个重要项目。孙清峰此前是微软的NLP研究科学家,在Bing和Office 365等产品的核心模型研发中积累了丰富经验。郑开与徐灿长期搭档,是WizardLM和Evol-Instruct指令优化方法的联合发起人,在模型训练架构上扮演关键角色。据悉,该团队其余几位技术骨干的入职也在2025年春季陆续完成。
格局未定,但势能已显
接连引入薄列峰、徐灿等领军人物及其核心团队,表明腾讯混元正快速构建一支覆盖视觉与语言多模态的顶尖技术阵容。这清晰地传递出一个信号:混元已不再满足于“追赶者”的角色,而是试图建立自身独立的技术节奏与研发体系。
当然,大模型领域的最终格局远未尘埃落定。技术的先进性最终需通过产品与市场的检验。接下来最关键的问题是,这些汇聚而来的顶级技术能力,能否在腾讯庞大的产品生态中成功落地,并转化为真正具有影响力的用户体验。
挑战固然存在,但腾讯混元已站在一个新的起点上。其后续动作,将是观察国内大模型竞争态势的重要窗口。