一张坐标系，拆解国产大模型玩家“明牌”与“暗牌”

2026-04-26阅读 460热度 460

国产大模型

拆解5家头部国产大模型2026年到底在布什么局？

今年开年以来，国产大模型领域的动态，用“目不暇接”来形容毫不为过。新模型的口碑转化、上市公司的市值波动、大厂频繁的组织调整……各种信号交织在一起，别说普通观察者，就连不少业内人士也坦言“有点看不清”。

那么，如何才能拨开迷雾，看清本质？一个有效的方法是建立坐标系。将主流国产大模型的战略重心，放在“国内与国外”、“B端与C端”这两组维度构成的四象限里审视，各家公司的取舍逻辑和布局重点，便会清晰许多。

放眼全球，2025年的大模型市场已经跑出了三条被验证的、最具“钱景”的路径：以OpenAI为代表的通用助手路线，率先在C端实现了规模化；以Anthropic Claude为代表的代码与智能体路线，其Claude Code的爆发堪称当下商业价值最高的赛道；而视频生成，作为Token消耗的“头号大户”，则是正在高速兑现的第三极。这三条路径，目前并驾齐驱。

那么，国内的模型巨头们，是如何在这张全球竞争版图上落子的？接下来，我们就逐一拆解。

01

MiniMax：从C端信仰者到B端入局者

港股上市的MiniMax，其股价走势一度成为市场焦点。这背后，是其商业板块正在进行一场深刻的调整——这家以海外ToC产品起家的公司，正开始向企业级市场发力。数据显示，2025年，其社交应用Talkie等C端产品贡献了公司七成收入，而企业级市场的占比已增长至三成。

信号是明确的。今年3月，MiniMax高调亮相华&为合作伙伴大会，这是一个以政企业务为核心的生态舞台。近期更有消息传出，原华&为云中国区副总裁胡维琦已加盟MiniMax。业界普遍解读，她的加入将显著增强MiniMax在企业级市场的拓展能力。

为何要进行这样的调整？核心在于构建更可持续的造血能力。有接近公司的人士透露，尽管C端产品具备规模化的想象空间，但海外C端用户的付费意愿存在增长天花板，且整体毛利率并不高。想要建立起像抖音那样兼具流量规模与盈利安全边际的“印钞机”模式，难度极大。这导致其难以支撑公司持续、大规模的盈利能力，OpenAI的ARR收入被Anthropic反超便是前车之鉴。因此，开拓B端市场成为必然选择。

有意思的是，MiniMax在创立初期曾主动回避企业级市场。创始团队亲历过AI 1.0时代，深知国内ToB市场极易陷入重度定制的泥潭，投入产出比极低。他们也不希望大模型技术重蹈人脸识别算法的覆辙，沦为没有壁垒、可以免费附送的工具。所以，MiniMax早期坚定押注C端，启用95后产品经理，甚至挑战了字节都未能必胜的社交产品赛道，目的就是找到一条能让用户心甘情愿付费的差异化路径。

如今转向B端，其业务抓手主要在两个方向。其一是视频生成，布局路径与字节旗下产品有相似之处。例如，与芒果TV合作文化出海项目，通过音视频融合技术让出海剧集不仅能“讲外语”，连口型都能精准匹配；与优酷合作上线纯AI短剧；在央视节目中，利用其视频模型“海螺”为歌手生成动态AI背景。

其二则是ARC（智能体、推理、代码）方向。这为国产大模型带来了一种全新的ToB商业模式——从过去定制化的重资产模式，转向轻量级的标准化API调用。这无疑降低了企业客户的使用门槛。MiniMax的定价策略也反映了其积极姿态，其M2.5模型在OpenRouter平台上的输出价格，仅为Claude Opus 4.6的1/20左右。据OpenRouter数据，MiniMax有两款模型在本周的调用量已跻身平台前五。

随着业务量攀升，单纯依赖公有云已面临性价比和效率瓶颈，难以针对自身模型特点灵活优化训推框架。为此，MiniMax也开始投入线下数据中心建设，部分转向自研训练和推理框架的AI基础设施。

02

智谱：从什么都做到专注代码

今年开年，智谱在代码模型领域的声势持续升温。其GLM-5.1发布后，配套的Coding Plan订阅一度“秒光”，需要每天定时抢购，供需矛盾十分突出。然而，在OpenRouter平台上，智谱GLM-5系列的定价在3到4美元/百万Token，高于多数国产模型，其调用量也已跌出前十。

这其实是智谱的渠道策略所致。有接近公司的资深人士指出，OpenRouter仅被视作补充渠道，核心流量被导向自家平台。从财务数据看，代码相关业务的收入增速确实亮眼，产品口碑也被认为已反超国内几家大厂。不过，必须清醒认识到，几家头部国产代码模型与全球领先的Claude相比，差距依然明显。

智谱能在代码赛道实现突破，是多重因素叠加的结果。首先，它是国内最早布局大模型和代码模型的企业之一，核心实验室团队规模超过两百人，人才密度高。其次，2025年DeepSeek爆火后，国内公司普遍反思基础模型研发的重要性，智谱也顺势加大了投入。最关键的是第三点：战略聚焦。此前智谱内部对标OpenAI，业务线铺得很广。从去年起，公司开始主动收&缩，将资源集中于代码方向，转而讲述成为“中国版Anthropic”的B端服务故事。

技术节点上，GLM-4.7于2025年12月发布，在编程与推理能力上实现了显著跃升，成为其口碑上升的重要转折点。在其发表的论文中，业内人士也注意到其对ARC（智能体、推理、代码）的着重探讨。

商业化层面，智谱此前的企业级收入高度依赖项目定制开发，本地化部署占2025年营收的73.7%（约5.34亿元）。但据了解，智谱团队对MaaS（模型即服务）平台的长期价值非常坚定。尽管这一模式在国内推进不易，但代码需求的爆发成为了关键转折点。标准化的API订阅快速放量，为MaaS路径打通了商业闭环，也为智谱提供了更具说服力的增长叙事。目前，定制化业务维持现金流，API订阅则作为第二增长曲线全力开拓。

值得注意的是，需求的快速增长也对智谱的基础设施提出了严峻挑战，宕机与响应变慢的问题时有发生。算力扩容与运维能力，仍是其亟待补上的短板。

03

字节：“控价保利”押注两大高Token场景

今年开年，字节在AI商业化上的核心叙事，依然高度聚焦于Token消耗的规模。4月在武汉的火山引擎开年巡展上，字节公布了一组关键数据：截至2026年3月，豆包大模型日均Token使用量已突破120万亿。这个全口径数据，涵盖了豆包App、火山引擎API、字节系产品内嵌AI及企业客户调用的全部消耗。

在模型能力支撑上，字节将重心明确指向了两大高Token消耗场景：视频创作与智能体应用。视频方向上，春节前发布的Seedance 2.0是关键节点。此前，受制于20%~30%的“抽卡率”（可用成片率），AI短剧与漫剧难以实现全自动化投产。有字节内部人士曾表示，“抽卡率跨过50%，才能产生显著商业价值”。Seedance 2.0发布后，抽卡率得到明显改善，具备了突破这一商业化门槛的可能性。

Seedance 2.0在企业级市场的开放，经历了一段合规准备期——初期先嵌入即梦、豆包等自有C端产品，待版权、IP保护等机制逐步完善后，火山引擎才于4月2日开放API公测，并于4月14日全面上线。

智能体方向，字节也将OpenClaw类应用列为重点。火山引擎CEO谭待指出，目前国内该类产品的用户盘仍在百万量级，但面向中国庞大的职场人群，规模化增长空间巨大。一个值得关注的细节是，在龙虾应用中，字节仍优先推荐自家大模型，这被业界解读为意在基础模型层构建核心壁垒的长线布局。

大厂能否在AI时代拿到真正的“船票”，强大的自研模型能力是必要条件。业界观察到，字节在大模型研发上并未操之过急，依然在坚持做原创和基础性研究。一个例证是，DeepSeek引发关注的mHC论文，其关键技术优化正是在字节2024年提出的HC（超连接）技术基础上完成的。当然，业界也普遍认为，包括字节在内的国内大厂，目前在ARC（智能体、推理、代码）方向上的投入仍有不足。

从商业层面看，据报道，字节旗下火山引擎2026年MaaS业务收入目标，已从2025年的20亿元量级，大幅上调至百亿元规模。为在生态层面占据主导，火山引擎近期宣布赞助支持OpenClaw官方技能商店ClawHub的中国镜像搭建，意图借助这一全球热门平台争夺开发者心智。

定价策略上，字节出现了明显转向。过去两年，火山引擎习惯在春季通过API降价以价换量。今年，在多家大厂相继宣布涨价的背景下，火山引擎转向了“控价保利”——收紧优惠、暂停首购特惠、取消部分补贴，Seedance 2.0的定价也高于前代。这一转变清晰地表明，模型带来的价值正在被重估，变&现效率的优先级已显著提升。

04

阿里：组织重构，从“卖算力”到“卖Token”

今年开年以来，阿里围绕AI进行了一次堪称碘伏性的大规模组织重构。3月16日，集团宣布成立ATH组织（Alibaba Technology Holdings），由CEO吴泳铭亲自挂帅，将通义实验室、MaaS业务线、C端千问事业部、B端悟空事业部及AI创新事业部全部整合一体。其目标直指“创造Token、输送Token、应用Token”。

这次调整中，最具信号意义的动作有两个：一是通义实验室从阿里云下属的研究部门，升格为与电商、云并列的独立事业部；二是MaaS业务也从云业务中独立拆分。这意味着，AI能力不再仅仅是云计算的附属品，而是被提升至集团战略核心。同时，阿里设立“集团技术委员会”，将AI的决策权与资源调配权提升至最高层。据了解，自去年下半年起，阿里就已着手整合内部分散的AI条线，其核心命题正是商业模式的转型——从“算力即服务”转向“Token即服务”。

模型发布节奏也印证了这一转变。今年3月底至4月初短短四天内，阿里接连发布三款模型，并优先接入悟空、Qoder、千问App等内部生态，试图以内部消耗的方式快速验证模型商业价值。对于其闭源API调用边界的扩大，业内看法不一：有人担忧这是开源路线的收&缩；有人认为纯开源难以直接转化为商业收益，分层开闭源是现实的变&现选择；也有资深人士指出，开源本质上是追赶者的竞争策略，对全球头部模型公司而言，从未是核心战略重心。Anthropic未官宣开源，OpenAI与谷歌虽有开源动作，但多为内部小团队行为，且不具备持续性。

目光放得更远，阿里制定了未来五年云与AI商业化年收入突破1000亿美元的目标。这对应着需要维持47%以上的年均复合增长率。这个数字意味着，阿里必须将前期大规模研发投入，转化为可持续的规模化营收，从而破解此前“叫好不叫座”的困局。

05

DeepSeek：慢或是假象，留人才是真问题

DeepSeek最近又被“催更”了。过去一年多，其未推出大版本更新，技术迭代节奏似乎慢于业界预期。但若以豆包从1.0到2.0历时21个月为参照，DeepSeek的节奏其实并不算异常。事实上，动作一直在进行：2月将上下文窗口扩展至100万Token；3月底长达12小时的服务中断，被外界判断是新旧架构切换的主动升级代价；4月8日灰度上线的“快速模式”与“专家模式”，提升了应用体验，也被业内视为下一代旗舰模型V4发布前的关键预热。其论文产出也呈现出扎实的基础研究风格。

在资深观察者看来，DeepSeek的技术路线非常清晰：从代码模型起步，经数学模型突破，再到大语言模型和推理模型。其即将发布的V4，将是一个万亿参数级别、支持文本、图像、视频等多模态的旗舰产品。

然而，一个值得高度关注的风险点最近浮出水面：人才流失。2026年3月，DeepSeek核心模型主力作者之一郭达雅离职，随后加入字节跳动Seed团队。此人是DeepSeek-R1的第一作者。

这指向了一个潜在的结构性问题：DeepSeek既无上市计划，也未启动外部融资，在股权、薪酬等激励层面很难发力。在顶尖AI研究员身价堪比球星的市场环境下，这套机制难以支撑长期的人才保留。同时，团队对外部交流管理较严，商业化路径战略尚不清晰，可能让一些年轻研究员对个人发展心存顾虑。业界普遍判断，一旦启动融资，其估值不会低于MiniMax与智谱。能否在人才激励与商业化路径上适度打开局面，或许是团队下一阶段需要思考的关键命题。

此外，其他巨头的动向也值得留意。腾讯去年引入年轻研究员姚顺雨并赋予高度自主权主导自研模型，业界正等待其新成果发布；同时，腾讯在AI基础设施上也需要加速追赶。华&为盘古经历了一轮内部职能重组，大模型研发部分划入2012实验室，部分并入终端业务线，华&为云同时提出“行业AI梦工厂”，布局具身智能、智能制造等垂直领域。业界也提到，大模型的快速迭代创新与华&为传统业务对流程制度、极致可靠安全的要求，如何平衡并让AI人才保持活力，是需要探索的课题。百度则在4月14日发布了新一代多模态基础模型，并推进以昆仑芯和“龙虾”为代表的智能体应用。这几家大模型企业的后续动向，值得持续跟踪观察。