杨红霞创业项目测评:端侧模型估值1.5亿美元深度解析

2026-05-16阅读 0热度 0
ai

最近,字节跳动大模型研发专家杨红霞离职创业的消息,在圈内引起了不小的讨论。

根据我们掌握的信息,杨红霞已在今年5月下旬正式从字节跳动离职,目前正全力筹备自己的AI创业项目。有意思的是,她的方向并非时下最热的“大”模型,而是将目光投向了端侧模型,重点布局AI Agent。据悉,其团队正在组建中,并已获得3000万至4000万美元的投资,投后估值达到1.5亿美元。

杨红霞在业内成名已久。她曾是阿里达摩院万亿参数多模态大模型M6的技术负责人,也参与过国内最早的大模型项目之一——北京智源研究院的“悟道”项目。在学术背景浓厚的字节大模型团队中,她的履历显得尤为突出。团队其他核心成员多从抖音、西瓜视频等内部产品成长起来,而杨红霞则有着完整的“学院派”路径:2007年从南开大学本科毕业后,她赴杜克大学攻读博士学位,师从著名统计学家Da vid Dunson,期间发表了超过100篇学术论文。博士毕业后,她先后在IBM沃森研究院和雅虎担任研究员及首席数据科学家。

2016年回国加入阿里达摩院后,杨红霞职级为P9,并担任智能计算实验室主任,亲身主导并见证了M6模型从百亿、千亿到万亿参数的规模演进。去年初,她转战字节跳动,加入其机器学习系统团队,向负责人项亮汇报,带领一支约40人的技术队伍。如今,这位技术领军者的身份标签上,又增添了“创业者”这一项。

她的这次创业选择,恰好踩在了行业趋势转换的节点上。今年以来,通用大模型的竞争格局已初步显现,行业焦点正从“拼参数”转向“拼落地”。于是,更侧重具体行业应用、更能嵌入终端设备的端侧模型,开始受到越来越多的关注。这类模型直接部署在手机、电脑、智能汽车等设备上,优势很明显:成本更低、便于移动部署、而且由于数据不必上传云端,在隐私和安全方面也更有保障。

这股端侧模型的浪潮,今年已有多波推力。2月,从清华THUNLP走出的面壁智能,推出了20亿参数的开源端侧模型MiniCPM;4月,商汤发布了1.8B参数规模的SenseChat-Lite端侧版本;到了5月,来自斯坦福大学的NEXA AI团队更是扔出了一枚“深水冲击波”——他们发布了全球首个参数小于10亿的多模态AI Agent模型Octopus V3。其在函数调用等关键性能上表现惊人,甚至能与GPT-4V+GPT-4的组合相媲美,瞬间将端侧模型的竞争门槛拉高了一个层级。NEXA AI团队本身也背景亮眼,其创始人兼首席科学家陈伟正在斯坦福攻读博士,联合创始人兼CTO李志远则拥有斯坦福学历以及谷歌、亚马逊Lab 126实验室的端侧AI研发经验。

从手机到电脑,再到智能汽车,这些深度融入日常生活的终端设备,为端侧大模型提供了无比广阔的应用场景。当行业命题从“如何做得更大”转向“如何做得更小、更好用”时,这片蓝海市场,显然大有可为。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策