一张坐标系,拆解国产大模型玩家“明牌”与“暗牌”

2026-04-26阅读 460热度 460
国产大模型

拆解5家头部国产大模型2026年到底在布什么局?

今年开年以来,国产大模型领域的动态,用“目不暇接”来形容毫不为过。新模型的口碑转化、上市公司的市值波动、大厂频繁的组织调整……各种信号交织在一起,别说普通观察者,就连不少业内人士也坦言“有点看不清”。

那么,如何才能拨开迷雾,看清本质?一个有效的方法是建立坐标系。将主流国产大模型的战略重心,放在“国内与国外”、“B端与C端”这两组维度构成的四象限里审视,各家公司的取舍逻辑和布局重点,便会清晰许多。

放眼全球,2025年的大模型市场已经跑出了三条被验证的、最具“钱景”的路径:以OpenAI为代表的通用助手路线,率先在C端实现了规模化;以Anthropic Claude为代表的代码与智能体路线,其Claude Code的爆发堪称当下商业价值最高的赛道;而视频生成,作为Token消耗的“头号大户”,则是正在高速兑现的第三极。这三条路径,目前并驾齐驱。

那么,国内的模型巨头们,是如何在这张全球竞争版图上落子的?接下来,我们就逐一拆解。

01

MiniMax:从C端信仰者到B端入局者

港股上市的MiniMax,其股价走势一度成为市场焦点。这背后,是其商业板块正在进行一场深刻的调整——这家以海外ToC产品起家的公司,正开始向企业级市场发力。数据显示,2025年,其社交应用Talkie等C端产品贡献了公司七成收入,而企业级市场的占比已增长至三成。

信号是明确的。今年3月,MiniMax高调亮相华&为合作伙伴大会,这是一个以政企业务为核心的生态舞台。近期更有消息传出,原华&为云中国区副总裁胡维琦已加盟MiniMax。业界普遍解读,她的加入将显著增强MiniMax在企业级市场的拓展能力。

为何要进行这样的调整?核心在于构建更可持续的造血能力。有接近公司的人士透露,尽管C端产品具备规模化的想象空间,但海外C端用户的付费意愿存在增长天花板,且整体毛利率并不高。想要建立起像抖音那样兼具流量规模与盈利安全边际的“印钞机”模式,难度极大。这导致其难以支撑公司持续、大规模的盈利能力,OpenAI的ARR收入被Anthropic反超便是前车之鉴。因此,开拓B端市场成为必然选择。

有意思的是,MiniMax在创立初期曾主动回避企业级市场。创始团队亲历过AI 1.0时代,深知国内ToB市场极易陷入重度定制的泥潭,投入产出比极低。他们也不希望大模型技术重蹈人脸识别算法的覆辙,沦为没有壁垒、可以免费附送的工具。所以,MiniMax早期坚定押注C端,启用95后产品经理,甚至挑战了字节都未能必胜的社交产品赛道,目的就是找到一条能让用户心甘情愿付费的差异化路径。

如今转向B端,其业务抓手主要在两个方向。其一是视频生成,布局路径与字节旗下产品有相似之处。例如,与芒果TV合作文化出海项目,通过音视频融合技术让出海剧集不仅能“讲外语”,连口型都能精准匹配;与优酷合作上线纯AI短剧;在央视节目中,利用其视频模型“海螺”为歌手生成动态AI背景。

其二则是ARC(智能体、推理、代码)方向。这为国产大模型带来了一种全新的ToB商业模式——从过去定制化的重资产模式,转向轻量级的标准化API调用。这无疑降低了企业客户的使用门槛。MiniMax的定价策略也反映了其积极姿态,其M2.5模型在OpenRouter平台上的输出价格,仅为Claude Opus 4.6的1/20左右。据OpenRouter数据,MiniMax有两款模型在本周的调用量已跻身平台前五。

随着业务量攀升,单纯依赖公有云已面临性价比和效率瓶颈,难以针对自身模型特点灵活优化训推框架。为此,MiniMax也开始投入线下数据中心建设,部分转向自研训练和推理框架的AI基础设施。

02

智谱:从什么都做到专注代码

今年开年,智谱在代码模型领域的声势持续升温。其GLM-5.1发布后,配套的Coding Plan订阅一度“秒光”,需要每天定时抢购,供需矛盾十分突出。然而,在OpenRouter平台上,智谱GLM-5系列的定价在3到4美元/百万Token,高于多数国产模型,其调用量也已跌出前十。

这其实是智谱的渠道策略所致。有接近公司的资深人士指出,OpenRouter仅被视作补充渠道,核心流量被导向自家平台。从财务数据看,代码相关业务的收入增速确实亮眼,产品口碑也被认为已反超国内几家大厂。不过,必须清醒认识到,几家头部国产代码模型与全球领先的Claude相比,差距依然明显。

智谱能在代码赛道实现突破,是多重因素叠加的结果。首先,它是国内最早布局大模型和代码模型的企业之一,核心实验室团队规模超过两百人,人才密度高。其次,2025年DeepSeek爆火后,国内公司普遍反思基础模型研发的重要性,智谱也顺势加大了投入。最关键的是第三点:战略聚焦。此前智谱内部对标OpenAI,业务线铺得很广。从去年起,公司开始主动收&缩,将资源集中于代码方向,转而讲述成为“中国版Anthropic”的B端服务故事

技术节点上,GLM-4.7于2025年12月发布,在编程与推理能力上实现了显著跃升,成为其口碑上升的重要转折点。在其发表的论文中,业内人士也注意到其对ARC(智能体、推理、代码)的着重探讨。

商业化层面,智谱此前的企业级收入高度依赖项目定制开发,本地化部署占2025年营收的73.7%(约5.34亿元)。但据了解,智谱团队对MaaS(模型即服务)平台的长期价值非常坚定。尽管这一模式在国内推进不易,但代码需求的爆发成为了关键转折点。标准化的API订阅快速放量,为MaaS路径打通了商业闭环,也为智谱提供了更具说服力的增长叙事。目前,定制化业务维持现金流,API订阅则作为第二增长曲线全力开拓。

值得注意的是,需求的快速增长也对智谱的基础设施提出了严峻挑战,宕机与响应变慢的问题时有发生。算力扩容与运维能力,仍是其亟待补上的短板。

03

字节:“控价保利”押注两大高Token场景

今年开年,字节在AI商业化上的核心叙事,依然高度聚焦于Token消耗的规模。4月在武汉的火山引擎开年巡展上,字节公布了一组关键数据:截至2026年3月,豆包大模型日均Token使用量已突破120万亿。这个全口径数据,涵盖了豆包App、火山引擎API、字节系产品内嵌AI及企业客户调用的全部消耗。

在模型能力支撑上,字节将重心明确指向了两大高Token消耗场景:视频创作与智能体应用。视频方向上,春节前发布的Seedance 2.0是关键节点。此前,受制于20%~30%的“抽卡率”(可用成片率),AI短剧与漫剧难以实现全自动化投产。有字节内部人士曾表示,“抽卡率跨过50%,才能产生显著商业价值”。Seedance 2.0发布后,抽卡率得到明显改善,具备了突破这一商业化门槛的可能性。

Seedance 2.0在企业级市场的开放,经历了一段合规准备期——初期先嵌入即梦、豆包等自有C端产品,待版权、IP保护等机制逐步完善后,火山引擎才于4月2日开放API公测,并于4月14日全面上线。

智能体方向,字节也将OpenClaw类应用列为重点。火山引擎CEO谭待指出,目前国内该类产品的用户盘仍在百万量级,但面向中国庞大的职场人群,规模化增长空间巨大。一个值得关注的细节是,在龙虾应用中,字节仍优先推荐自家大模型,这被业界解读为意在基础模型层构建核心壁垒的长线布局。

大厂能否在AI时代拿到真正的“船票”,强大的自研模型能力是必要条件。业界观察到,字节在大模型研发上并未操之过急,依然在坚持做原创和基础性研究。一个例证是,DeepSeek引发关注的mHC论文,其关键技术优化正是在字节2024年提出的HC(超连接)技术基础上完成的。当然,业界也普遍认为,包括字节在内的国内大厂,目前在ARC(智能体、推理、代码)方向上的投入仍有不足。

从商业层面看,据报道,字节旗下火山引擎2026年MaaS业务收入目标,已从2025年的20亿元量级,大幅上调至百亿元规模。为在生态层面占据主导,火山引擎近期宣布赞助支持OpenClaw官方技能商店ClawHub的中国镜像搭建,意图借助这一全球热门平台争夺开发者心智。

定价策略上,字节出现了明显转向。过去两年,火山引擎习惯在春季通过API降价以价换量。今年,在多家大厂相继宣布涨价的背景下,火山引擎转向了“控价保利”——收紧优惠、暂停首购特惠、取消部分补贴,Seedance 2.0的定价也高于前代。这一转变清晰地表明,模型带来的价值正在被重估,变&现效率的优先级已显著提升。

04

阿里:组织重构,从“卖算力”到“卖Token”

今年开年以来,阿里围绕AI进行了一次堪称碘伏性的大规模组织重构。3月16日,集团宣布成立ATH组织(Alibaba Technology Holdings),由CEO吴泳铭亲自挂帅,将通义实验室、MaaS业务线、C端千问事业部、B端悟空事业部及AI创新事业部全部整合一体。其目标直指“创造Token、输送Token、应用Token”。

这次调整中,最具信号意义的动作有两个:一是通义实验室从阿里云下属的研究部门,升格为与电商、云并列的独立事业部;二是MaaS业务也从云业务中独立拆分。这意味着,AI能力不再仅仅是云计算的附属品,而是被提升至集团战略核心。同时,阿里设立“集团技术委员会”,将AI的决策权与资源调配权提升至最高层。据了解,自去年下半年起,阿里就已着手整合内部分散的AI条线,其核心命题正是商业模式的转型——从“算力即服务”转向“Token即服务”。

模型发布节奏也印证了这一转变。今年3月底至4月初短短四天内,阿里接连发布三款模型,并优先接入悟空、Qoder、千问App等内部生态,试图以内部消耗的方式快速验证模型商业价值。对于其闭源API调用边界的扩大,业内看法不一:有人担忧这是开源路线的收&缩;有人认为纯开源难以直接转化为商业收益,分层开闭源是现实的变&现选择;也有资深人士指出,开源本质上是追赶者的竞争策略,对全球头部模型公司而言,从未是核心战略重心。Anthropic未官宣开源,OpenAI与谷歌虽有开源动作,但多为内部小团队行为,且不具备持续性。

目光放得更远,阿里制定了未来五年云与AI商业化年收入突破1000亿美元的目标。这对应着需要维持47%以上的年均复合增长率。这个数字意味着,阿里必须将前期大规模研发投入,转化为可持续的规模化营收,从而破解此前“叫好不叫座”的困局。

05

DeepSeek:慢或是假象,留人才是真问题

DeepSeek最近又被“催更”了。过去一年多,其未推出大版本更新,技术迭代节奏似乎慢于业界预期。但若以豆包从1.0到2.0历时21个月为参照,DeepSeek的节奏其实并不算异常。事实上,动作一直在进行:2月将上下文窗口扩展至100万Token;3月底长达12小时的服务中断,被外界判断是新旧架构切换的主动升级代价;4月8日灰度上线的“快速模式”与“专家模式”,提升了应用体验,也被业内视为下一代旗舰模型V4发布前的关键预热。其论文产出也呈现出扎实的基础研究风格。

在资深观察者看来,DeepSeek的技术路线非常清晰:从代码模型起步,经数学模型突破,再到大语言模型和推理模型。其即将发布的V4,将是一个万亿参数级别、支持文本、图像、视频等多模态的旗舰产品。

然而,一个值得高度关注的风险点最近浮出水面:人才流失。2026年3月,DeepSeek核心模型主力作者之一郭达雅离职,随后加入字节跳动Seed团队。此人是DeepSeek-R1的第一作者。

这指向了一个潜在的结构性问题:DeepSeek既无上市计划,也未启动外部融资,在股权、薪酬等激励层面很难发力。在顶尖AI研究员身价堪比球星的市场环境下,这套机制难以支撑长期的人才保留。同时,团队对外部交流管理较严,商业化路径战略尚不清晰,可能让一些年轻研究员对个人发展心存顾虑。业界普遍判断,一旦启动融资,其估值不会低于MiniMax与智谱。能否在人才激励与商业化路径上适度打开局面,或许是团队下一阶段需要思考的关键命题。

此外,其他巨头的动向也值得留意。腾讯去年引入年轻研究员姚顺雨并赋予高度自主权主导自研模型,业界正等待其新成果发布;同时,腾讯在AI基础设施上也需要加速追赶。华&为盘古经历了一轮内部职能重组,大模型研发部分划入2012实验室,部分并入终端业务线,华&为云同时提出“行业AI梦工厂”,布局具身智能、智能制造等垂直领域。业界也提到,大模型的快速迭代创新与华&为传统业务对流程制度、极致可靠安全的要求,如何平衡并让AI人才保持活力,是需要探索的课题。百度则在4月14日发布了新一代多模态基础模型,并推进以昆仑芯和“龙虾”为代表的智能体应用。这几家大模型企业的后续动向,值得持续跟踪观察。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策