杨红霞创业项目测评：端侧模型估值1.5亿美元深度解析

2026-05-16阅读 0热度 0

最近，字节跳动大模型研发专家杨红霞离职创业的消息，在圈内引起了不小的讨论。

根据我们掌握的信息，杨红霞已在今年5月下旬正式从字节跳动离职，目前正全力筹备自己的AI创业项目。有意思的是，她的方向并非时下最热的“大”模型，而是将目光投向了端侧模型，重点布局AI Agent。据悉，其团队正在组建中，并已获得3000万至4000万美元的投资，投后估值达到1.5亿美元。

杨红霞在业内成名已久。她曾是阿里达摩院万亿参数多模态大模型M6的技术负责人，也参与过国内最早的大模型项目之一——北京智源研究院的“悟道”项目。在学术背景浓厚的字节大模型团队中，她的履历显得尤为突出。团队其他核心成员多从抖音、西瓜视频等内部产品成长起来，而杨红霞则有着完整的“学院派”路径：2007年从南开大学本科毕业后，她赴杜克大学攻读博士学位，师从著名统计学家Da vid Dunson，期间发表了超过100篇学术论文。博士毕业后，她先后在IBM沃森研究院和雅虎担任研究员及首席数据科学家。

2016年回国加入阿里达摩院后，杨红霞职级为P9，并担任智能计算实验室主任，亲身主导并见证了M6模型从百亿、千亿到万亿参数的规模演进。去年初，她转战字节跳动，加入其机器学习系统团队，向负责人项亮汇报，带领一支约40人的技术队伍。如今，这位技术领军者的身份标签上，又增添了“创业者”这一项。

她的这次创业选择，恰好踩在了行业趋势转换的节点上。今年以来，通用大模型的竞争格局已初步显现，行业焦点正从“拼参数”转向“拼落地”。于是，更侧重具体行业应用、更能嵌入终端设备的端侧模型，开始受到越来越多的关注。这类模型直接部署在手机、电脑、智能汽车等设备上，优势很明显：成本更低、便于移动部署、而且由于数据不必上传云端，在隐私和安全方面也更有保障。

这股端侧模型的浪潮，今年已有多波推力。2月，从清华THUNLP走出的面壁智能，推出了20亿参数的开源端侧模型MiniCPM；4月，商汤发布了1.8B参数规模的SenseChat-Lite端侧版本；到了5月，来自斯坦福大学的NEXA AI团队更是扔出了一枚“深水冲击波”——他们发布了全球首个参数小于10亿的多模态AI Agent模型Octopus V3。其在函数调用等关键性能上表现惊人，甚至能与GPT-4V+GPT-4的组合相媲美，瞬间将端侧模型的竞争门槛拉高了一个层级。NEXA AI团队本身也背景亮眼，其创始人兼首席科学家陈伟正在斯坦福攻读博士，联合创始人兼CTO李志远则拥有斯坦福学历以及谷歌、亚马逊Lab 126实验室的端侧AI研发经验。

从手机到电脑，再到智能汽车，这些深度融入日常生活的终端设备，为端侧大模型提供了无比广阔的应用场景。当行业命题从“如何做得更大”转向“如何做得更小、更好用”时，这片蓝海市场，显然大有可为。

杨红霞创业项目测评：端侧模型估值1.5亿美元深度解析

相关阅读

最新教程

最新资讯