DeepSeek终于要融资了？而五家国产大模型都找到了赚钱的路

2026-04-26阅读 893热度 893

DeepSeek

拆解5家头部国产大模型企业，2026年选择了哪些最好的赛道？

今年开年，国产大模型领域的动态之密集、变化之剧烈，让不少圈内人都直呼“有点跟不上节奏”。

你看，一向宣称不融资、不上市的DeepSeek，据传开始接触外部资本；智谱的编程模型口碑悄然攀升；MiniMax和智谱上市后市值双双冲高；阿里则进行了一轮大规模的组织重组……这一系列动作背后，究竟藏着怎样的逻辑？

其实，要看清局面，不妨先建立一个坐标系。业内资深分析指出，当前主流国产大模型的战略重心，可以用“国内与海外”、“B端与C端”这两组维度来交叉划分，从而构成一个清晰的四象限图景。

在这个坐标系里，2025年的全球市场已经跑通了三条被验证的盈利路径：以OpenAI为代表的通用助手路线，率先在C端实现了规模化；以Anthropic Claude为代表的代码与智能体路线，其Claude Code的爆发堪称当下商业价值最高的赛道；而作为Token消耗第一大户的视频生成，则是正在高速兑现的第三极。

那么，国内的模型厂商们，是如何在这张战略地图上落子的？我们来逐一拆解。

DeepSeek：慢或是假象，留人或是真问题

一向“不差钱”的DeepSeek，也开始找钱了？根据外媒The Information的报道，DeepSeek正在与外部资本接洽，寻求至少3亿美元的首次外部融资，估值预计不低于100亿美元。业界普遍判断，一旦启动融资，其估值基准不会低于已上市的MiniMax与智谱。

这背后，其实指向一个更根本的问题：人才。有消息显示，DeepSeek的核心团队持续面临竞争对手的挖角，近期甚至曝出R1核心模型的主力作者之一郭达雅离职加入字节跳动Seed团队。此前，为V3模型做出关键贡献的研究员罗福莉也已加盟小米。这暴露了一个结构性挑战——在顶尖AI研究员身价水涨船高的市场环境下，一家没有上市计划、也未启动外部融资的公司，在股权激励等长期留人手段上难免捉襟见肘。同时，团队相对封闭的对外交流风格和不够清晰的商业化路径，也可能让一些年轻研究员对个人发展前景产生疑虑。如何平衡技术理想与商业现实，在人才留存和商业化上适度打开局面，无疑是创始人梁文锋下一阶段需要思考的关键命题。

产品层面，DeepSeek似乎一直被外界催促“快一点”。过去一年多，其未推出碘伏性的大版本更新，技术迭代节奏被部分人认为慢于行业预期。但若以豆包大版本迭代周期（21个月）作为参照，DeepSeek的节奏其实并不算慢：今年2月将上下文窗口扩展至100万Token；3月一次长达12小时的服务中断，被推测可能是主动升级付出的代价；4月8日灰度上线的“快速模式”与“专家模式”，则被广泛视为下一代旗舰模型V4发布前的关键预热。其论文产出也保持着扎实、稳健的风格。

当然，V4的研发本身面临巨大挑战。除了模型本身的技术与工程难度，团队还投入了大量精力用于与国产芯片的底层适配，这种“开箱即用”的兼容性工作，短期内必然拉长研发周期。加之算力成本持续攀升，单纯依靠幻方自有资金已显得力不从心。尽管融资传闻的金额和估值引发了一些讨论，但DeepSeek对资本的需求，在当下这个节点确实变得迫切起来。

MiniMax：从C端信仰者到B端入局者

港股上市的MiniMax股价表现强劲，吸引了众多目光。仔细观察其商业布局会发现，自去年以来，公司正在进行一场调整——在以海外ToC产品成功起步后，正开始向企业级市场发力。2025年，其社交应用Talkie等C端产品贡献了公司七成收入，而企业级市场的收入占比已提升至三成。

今年3月，MiniMax高调亮相华&为合作伙伴大会，这是一个以政企业务为核心的生态舞台。近期更有消息称，原华&为云中国区副总裁胡维琦已加入MiniMax，她的加盟被普遍认为将显著增强公司在企业级业务及中国市场的拓展能力。

这场调整的核心动因在于强化自身的造血能力。有接近公司的人士透露，尽管C端产品具备规模化的潜力，但海外C端用户的付费增长存在天花板，且毛利率并不高，难以像抖音那样建立起流量与变&现的“安全边际”，不足以支撑公司持续的规模化盈利。因此，发力B端市场成为必然选择。

有意思的是，MiniMax创立初期曾主动回避企业级市场。创始团队闫俊杰和贠烨祎完整经历了AI 1.0时代，深知国内ToB市场极易陷入重度定制的泥潭，投入产出比极低。他们也希望避免大模型技术重蹈人脸识别算法那样沦为没有壁垒、免费附赠的覆辙。因此，公司早期坚定押注C端，启用年轻的产品经理，挑战连字节都未能必胜的社交产品赛道，最终找到了让用户愿意付费的差异化路径。

如今，MiniMax在企业级市场的拓展主要聚焦两个方向：一是视频生成，其布局路径与字节旗下产品有相似之处。例如与芒果TV合作文化出海项目，通过音视频融合技术让出海热剧不仅能“讲外语”，口型也能精准匹配；与优酷合作上线纯AI短剧；在央视节目中，利用自研视频模型“海螺”为歌手生成动态AI背景。

另一大业务则是ARC（智能体、推理、编程）。这为国产大模型带来了一种全新的ToB商业模式——从过去定制化的重资产模式，转向轻量级的标准化API调用。这无疑为开拓企业市场创造了更有利的条件。MiniMax M2.5在开发者平台OpenRouter上的模型输出价格，仅为Claude Opus 4.6的约1/20，积极的定价策略反映了其抢占市场的决心。根据OpenRouter的数据，MiniMax已有两款模型的调用量进入平台前五。

随着业务量攀升，单纯依赖公有云已面临性价比和效率瓶颈，难以针对自身模型特点灵活优化训推框架。为此，MiniMax也开始投入线下数据中心建设，部分转向自研训练和推理框架的AI基础设施。

智谱：从什么都做到专注代码

今年开年以来，智谱在编程模型领域的声量突然放大。GLM-5.1发布后，配套的Coding Plan订阅一度“秒光”，每天定时抢购仍供不应求，市场需求明显大于供给。然而，在OpenRouter上，智谱GLM-5系列的定价在3到4美元/百万Token，高于多数国产模型，其调用量也已跌出平台前十。这一系列矛盾现象让不少行业观察者感到困惑。

有接近智谱的资深人士道出了其中缘由：这其实是公司的渠道策略使然。OpenRouter仅作为补充渠道，核心流量和资源都导向自家平台。从财务数据看，编程相关收入的增速确实亮眼，产品口碑也被认为已反超国内几家大厂。不过，几家头部国产编程模型与全球领先的Claude相比，差距依然明显。

智谱能在编程赛道上取得突破，是多重因素叠加的结果：首先，它是国内最早布局大模型和编程模型的企业之一，核心实验室团队规模超过两百人，人才密度高。其次，2025年DeepSeek爆火后，国内公司普遍反思基础模型研发的重要性，智谱也顺势加大了投入。最关键的是战略层面的主动聚焦。此前智谱内部对标OpenAI，广泛铺开各类模型，业务线较为分散。从去年起，公司开始收索战线，将资源集中投向代码方向，叙事也从“中国版OpenAI”转向了“中国版Anthropic”的B端服务商。

在其去年发表的论文中，业内人士注意到其重点探讨了ARC（智能体、推理、编程）。技术层面上，2025年12月发布的GLM-4.7在编程与推理能力上实现跃升，成为其口碑上升的重要转折点。

商业化方面，智谱此前企业级收入高度依赖项目定制和本地化部署，后者在2025年营收中占比高达73.7%（约5.34亿元）。但据了解，以唐杰教授为核心的团队对MaaS（模型即服务）平台的长期价值非常坚定，尽管这一模式在国内市场此前推进并不容易。编程需求的爆发成为了关键转折点，标准化的API订阅服务快速放量，为MaaS路径打通了商业闭环，也为智谱等国内厂商提供了一个更具说服力的增长故事。目前，定制化业务维持着公司现金流，而API订阅则作为第二增长曲线全力开拓。

值得关注的是，需求的快速增长也对智谱的基础设施提出了严峻挑战，服务宕机与响应变慢的情况时有发生，算力扩容与运维能力仍是亟待补上的短板。

字节：“控价保利”押注两大高Token场景

今年开年，字节在AI商业化上的核心叙事，依然高度集中在Token消耗的规模上。4月在武汉举办的火山引擎开年巡展上，字节公布截至2026年3月，豆包大模型日均Token使用量已突破120万亿。这个全口径数据涵盖了豆包App、火山引擎API、字节系产品内嵌AI以及企业客户调用的全部消耗。

在模型能力建设上，字节将支撑重心明确指向了两大高Token消耗场景：视频创作与智能体应用。其中，视频方向的关键节点是春节前发布的Seedance 2.0。此前，受制于20%-30%的“抽卡率”（指生成可用视频的成功率），AI短剧与漫剧难以实现全自动化投产。字节内部曾有一个判断：“抽卡率必须跨过50%的门槛，才能产生显著的商业价值”。Seedance 2.0发布后，抽卡率得到明显改善，使其具备了突破这一商业化门槛的可能性。

Seedance 2.0在企业级市场的开放经历了一段合规准备期——初期先以嵌入即梦、豆包等自有C端产品的形式提供服务，待版权、IP保护等机制逐步完善后，火山引擎于4月2日开放API公测，并在4月14日全面上线。

智能体方向，字节也将OpenClaw类应用列为重点押注场景。火山引擎CEO谭待介绍，目前国内该类产品的用户盘仍在百万量级，但面向中国庞大的职场人群，其规模化增长空间巨大。值得注意的是，在自家的“龙虾”应用中，字节仍优先推荐使用自家大模型，这被业界解读为意在基础模型层构建长期核心壁垒的战略布局。

大厂能否在AI时代拿到真正的“船票”，强大的自研模型能力是关键。业界观察到，字节在大模型研发上并未急于求成，没有采用“蒸馏”等捷径，依然坚持进行原创性和基础性研究。一个例证是，DeepSeek引起关注的mHC论文，正是在字节2024年提出的HC（超连接）技术基础上完成的关键优化。不过，业界也普遍认为，包括字节在内的国内大厂，目前在ARC（智能体、推理、编程）方向上的投入仍显不足。

从模型调用和商业目标来看，据媒体报道，字节旗下火山引擎2026年MaaS业务收入目标已从2025年的20亿元量级，大幅上调至百亿元规模，大模型及相关AI工具销售成为销售端的核心考核指标。为了在生态层面占据主导，火山引擎近期宣布赞助支持OpenClaw官方技能商店ClawHub的中国镜像搭建，意在借助这一全球热门平台争夺开发者心智。

定价策略上，字节出现了明显转向。过去两年，火山引擎习惯在春季推出API调用降价活动，以价换量抢占市场份额。而今年，在多家大厂相继宣布涨价的背景下，火山引擎转向了“控价保利”——收紧优惠、暂停首购特惠、取消部分补贴等，Seedance 2.0的定价也高于前代。这一转变清晰地表明，随着模型带来的价值提升，变&现效率的优先级正在提高。

阿里：组织策略调整破解“叫好不叫座”局面

今年开年以来，阿里围绕AI进行了一次大规模的组织重构。3月16日，集团宣布成立ATH组织（Alibaba Technology Holdings），由CEO吴泳铭亲自挂帅，将通义实验室、MaaS业务线、C端千问事业部、B端悟空事业部及AI创新事业部整合为一体，目标直指“创造Token、输送Token、应用Token”。

外界认为，此次调整最具信号意义的动作有两点：一是通义实验室从阿里云下属的研究部门，升格为与电商、云并列的独立事业部；二是MaaS业务也从云业务中拆分独立。这意味着，AI能力从此前附属于云计算体系的定位，被战略性地升级为集团层面的核心业务。同时，阿里设立“集团技术委员会”，将AI的决策权与资源调配权提升至最高层。据了解，自去年下半年起，阿里就已着手整合内部分散的AI条线，核心命题是实现商业模式从“算力即服务”向“Token即服务”的转型。

模型层面，今年3月底至4月初短短四天内，阿里接连发布三款新模型，并优先接入悟空、Qoder、千问App等内部生态，试图通过内部消耗的方式来快速验证模型的商业价值。

对于其闭源API调用业务边界的扩大，业内看法不一：有人担忧这是开源路线的收索；有人认为纯开源难以直接转化为商业收益，阿里转向分层级的开闭源结合是变&现逻辑下的现实选择；也有资深人士指出，开源本质上是追赶者的一种竞争策略，对于全球头部模型公司而言，从未成为其核心战略重心——Anthropic未官宣开源，OpenAI与谷歌虽有开源动作，但多为内部小团队行为，且不具备持续性。

在更长周期的目标上，阿里制定了未来五年云与AI商业化年收入突破1000亿美元的宏伟目标，这要求维持47%以上的年均复合增长率。这个数字意味着，如何将前期巨额研发投入，转化为可持续的规模化营收，从而破解此前“叫好不叫座”的困局，是摆在面前的最大挑战。

此外，其他大厂也有新动向。腾讯在去年引入年轻研究员姚顺雨并赋予高度自主权主导自研模型，业界正等待其新产品的发布；同时，腾讯在AI基础设施方面也需要加速追赶。华&为盘古大模型经历了一轮内部职能重组，部分研发划入2012实验室，另一部分并入终端业务线，华&为云同时提出“行业AI梦工厂”，布局具身智能、智能制造等垂直领域。业界也提到，大模型业务强调快速迭代创新，而华&为传统业务依赖流程制度保障极致可靠，如何平衡两者、让年轻AI人才充分发挥价值，是需要探索的课题。百度近期的动作则集中在昆仑芯的推进以及以“龙虾”为代表的智能体应用上，新模型仍处于研发阶段，尚未明确发布节点。这几家大模型企业的后续动向，值得持续跟踪观察。