2025年AI反向传播算法TOP5深度对比

2026-06-01阅读 0热度 0

Back

好的，没问题。作为一名深耕科技投资领域的专家，我很乐意帮你把这份干货满满的行业分析，打磨成一篇既有专业深度又富有阅读节奏的文章。以下是经过人性化重写后的版本：

2025年AI领域的进展，很大程度上是2024年就已经显现的诸多趋势的延续和深化。在2024年底，我们就曾指出，以DeepSeek和Qwen为代表的中国模型，正成为其西方同行不可忽视的竞争者。与此同时，推理能力的提升和“计算机使用”功能的出现，催生了一个全新的概念——AI Agent。这些进步背后，是对大规模AI基础设施投资的高速增长。而这些主题，都毫无意外地延续到了2025年。

真正让2025年变得与众不同的，是这些趋势推进的速度和规模。整个行业的AI资本支出（CapEx）达到了4000亿美元，几乎是前一年的两倍。在应用层，像Manus、Cursor和Lovable这样的公司，在短短数月内，就从双位数的ARR（年经常性收入）规模，飙升至数亿美元，这在科技行业的历史上堪称前所未有。与此同时，中国的开源大语言模型（LLM）在各大开源榜单上占据了主导地位。

2025年并没有太多本质上的范式革新，更多的是对已有趋势的验证和加速，将原本需要多年才能走完的发展历程，压缩在了一年之内完成。下面，我们就来回顾一下这一年的进展，并展望一下2026年。

基础设施层：从芯片瓶颈到系统瓶颈

如果要一句话总结AI基础设施层面正在发生的变化，那就是：芯片层面的瓶颈，正在让位于系统层面的瓶颈。所谓的“系统层面”，指的是那些支撑芯片大规模运行的外围设施——网络、电力传输、冷却系统、数据中心基础设施，以及最终的能源本身。早在2025年4月，埃隆·马斯克就曾表达过类似的观点。

我们绝不是暗示英伟达、AMD或博通这样的芯片巨头会变得无关紧要。实际上，从我们自己的渠道调研来看，最新一代芯片的供应依然紧张。但这意味着，能源安全和韧性将成为一个更重要的议题。当长期瓶颈日益向能源转移时，像中国这样在这方面拥有结构性优势的国家，将比美国等国家获得相对优势（如下图所示）。

数据来源: Our World in Data

我们仍处于早期到中期的阶段

尽管2025年投入了约4000亿美元的巨额资本支出，但多项信号表明，未来的路还很长。

首先，回顾以往的技术周期，如铁路、电话和互联网，资本支出平均需要10到20年才能达到顶峰。以互联网投资周期为例，它始于90年代初，直到2000年才达到峰值，最终以互联网泡沫破裂告终。如果我们把ChatGPT的发布视为本周期“iPhone时刻”的起点，那么我们现在才刚刚走了四年。

数据来源: 旧金山联邦储备银&行

其次，目前全球只有约5%的数据中心容量是GPU或AI驱动的。绝大部分现有数据中心仍基于CPU，为传统的非AI工作负载优化。如果我们相信未来大多数数据中心最终都需要支持AI工作负载，那么这场转型才刚刚开始。

第三，像谷歌、微软、亚马逊和Meta这样的科技巨头，它们合计占据了超过90%的AI资本支出，并继续将AI视为关乎其存亡的战略优先事项。从高管的言论中，几乎看不出有削减支出的迹象。或许更重要的是，投资者对此也一直保持支持。谷歌的股票在2026年上涨了65%，很大程度上得益于Gemini 3的成功发布及其在AI领域的强势回归。这些因素都表明，AI军备竞赛依然如火如荼，竞争的紧迫性还没有被资本支出的纪律所取代。

然而，一些早期的裂痕也开始显现。AI云服务提供商CoreWea ve的股价在上市后一度涨至发行价的4倍以上，但随后大幅回撤。同样，甲骨文（Oracle）在与OpenAI高调宣布合作后股价飙升了150%，但之后也从高点回落了超过30%。这些波动表明，尽管投资者总体上仍对AI交易持支持态度，但市场已出现了一些早期的谨慎信号。

在我们看来，基础设施层的市场情绪，越来越取决于像OpenAI和Anthropic这些基础模型实验室自身的财务健康状况和可持续性。例如，甲骨文约5000亿美元的总履约义务中，大约有60%与OpenAI绑定。任何对这些实验室偿付能力或可持续性的质疑，都可能在更广泛的生态系统中引起连锁反应。但只要这些实验室还能不断找到资金来源，基础设施层的系统性风险就大概率是可控的。

2026年预测：基础设施层

2026年不会达到投资顶峰，但增速将开始放缓。英伟达仍然是整体基础设施支出的一个有效风向标。尽管这家芯片制造商的增长速度依然强劲，但其营收增速已从之前90%的峰值有所回落。正如前面提到的，我们才刚刚进入当前投资周期的第四年。不过，我们认为这个周期会比以往的技术周期更短，因为AI的投资回报路径更清晰、更快速。在互联网时代，由于网络效应的存在，你必须先建立一个庞大的用户基础，技术才能变得有用。AI则不同，它能即时提供价值，一个用户就能从ChatGPT中获得巨大收益。因此，投资回报率更清晰，收入增长更快，资本投入也更快。

硬件/芯片层将出现更多元化的选择。英伟达仍然是芯片制造商中毋庸置疑的“800磅大猩猩”，但其利润率实在太高了，以至于这个行业不可能永远不被碘伏。一些可靠的替代方案已经开始出现，比如谷歌TPU的性能提升。同样，AMD的数据中心业务也持续向好。芯片层面的多元化，对整个生态系统来说应当是件好事，它会导致企业和消费者的价格下降，并加速AI的普及。

数据中心建设将面临重大延误。今年有本好书叫《Breakneck》。书中作者提出，美国的精英多是律师，而中国的精英则更多是工程师。这带来的实际影响是，美国系统在结构上更倾向于风险规避和流程管控，而非快速建设。事实上，我们在美国公共和私营部门都已经看到了这种动态。我们预计，同样的结构性摩擦也将减缓大规模数据中心的建设进程。这再次印证了，系统层面的瓶颈将可能制约AI发展的速度。

内存和存储将变得越来越重要。AI Agent需要是有状态的，换句话说，它们需要记住东西。每次Agent学习、回忆或交互，都会产生需要存储的新数据。这些数据可以是文本形式，但未来会越来越多模态化和基于行为交互。因此，内存，或者说存储，是累积且不断叠加的瓶颈。相比之下，计算是短暂的，可以在一个推理任务完成后被回收用于下一个任务。如何更有效地存储和检索信息，是一个值得深思的问题。

模型层：中国作为碘伏者

2025年的第一个重大事件是2025年1月DeepSeek R1的发布。虽然我们在2024年就已经预见到了中国大语言模型的崛起，但DeepSeek R1模型的能力还是让我们自己感到惊讶。它的核心创新在于，证明了强大的推理能力可以通过大规模强化学习，在“后训练”阶段利用激进的推理时计算扩展来实现，而不仅仅依赖于更大的预训练模型。

摘自我们2024年的年度回顾

R1的发布引发了市场剧烈反应，英伟达股价单日下跌15%。投资者将其解读为，未来的模型性能可能不再需要大规模的蛮力计算，因此也不需要那么多GPU了。但这种观点忽略了非常重要的一点：那些减少训练需求的同一套技术，同样也会增加推理需求。

回到中国的话题上，我们认为需要问两个关键问题：中国开源模型会持续追赶西方的闭源模型吗？以及，中国模型会对西方造成大规模的碘伏吗？

对于第一个问题，我们的看法是，短期内中国模型很难达到最先进的水平，主要受限于硬件层。DeepSeek展示了中国在算法和训练创新上的强大竞争力，但今天的顶尖模型仍然高度依赖最先进的芯片。巧妇难为无米之炊。中国模型的持久优势在于成本-性能比。如果能源成为AI的长期主要瓶颈，那么中国凭借其大规模且成本更低的能源供应，完全有能力实现单位推理能耗成本最低。长远来看，如果国内硬件也赶上来，算法创新和能源优势的结合，有可能让中国实验室在前沿领域一较高下。但这条路可能还比较漫长。

对于第二个问题，我们认为中国模型的威胁在企业端要高于消费端。在消费端，一个中国模型公司单纯通过聊天机器人挑战ChatGPT或Gemini的可能性不大。不过，就像TikTok碘伏社交媒体一样，一个中国的消费级AI应用，而非模型本身，仍有可能随着时间的推移获得巨大市场影响力。在企业端，情况则有所不同。这里，成本和单位经济模型更为重要，中国开源模型能够提供令人心动的成本优势。对于上层的AI应用公司来说，它们的利润率直接与Token和API成本挂钩，推理成本的任何降低都会直接改善其利润表。有传言称，一些西方的应用公司已经开始微调中国模型。趋势也印证了这一点，Hugging Face上中国模型的下载量已经超过了美国模型。

数据来源: State of AI

谷歌的逆袭

2025年，我们还看到了领先大模型提供商之间市场份额的重大转移。Anthropic在企业市场份额上已经超过了OpenAI，而谷歌在CEO桑达尔·皮查伊于2023年初下达“红色代码”后，也基本追上了AI竞赛的步伐。这迫使萨姆·奥尔特曼在2025年底也发布了自己的“红色代码”。

数据来源: Menlo Ventures

我们非常看好谷歌在AI竞赛中的地位。首先，垂直整合让他们能拥有更多技术栈，减少利润向英伟达等芯片制造商和基础设施供应商的流失。其次，强大的自由现金流让他们能维持激进的定价策略。第三，可能也是最重要的一点，谷歌的数据优势无人能及，它在搜索、地图、邮箱、文档、YouTube、照片、安卓等领域积累了数十年的多模态用户数据。这种多样性产生了更丰富的预训练语料库，带来了更好的模型泛化能力。

这些优势赋予了谷歌将价格大幅下压的选项。虽然它目前还没这么做，但一旦做了，就会给其他独立模型实验室带来额外的压力。我们认为，谷歌最终会成为这一层的价格制定者，而其他公司则只能被迫跟随。

相比之下，像OpenAI这样的创业公司处境则更复杂一些。它们一方面要同时向投资者展示盈利路径，另一方面还要继续筹集数千亿美元来保持在技术前沿的竞争力。外部估计显示，OpenAI可能要到2030年才能盈利，而Anthropic可能会更早，在2027-2028年左右实现盈亏平衡。

最终，这些独立实验室的命运不仅取决于自身的执行力，也取决于投资者的持续信念，以及谷歌、微软等巨头们的战略选择。它们有一个重要的优势，就是它们在整个生态系统中的核心地位：包括英伟达和甲骨文在内的大量行业参与者，在经济上都依赖于它们的持续成功，这为它们提供了一种隐性的战略支持。

数据来源: The Information

2026年预测：模型层

至少有一家主要实验室会寻求上市或被收购。前沿模型开发越来越取决于资本的可获得性。随着一级市场投资者对AI交易变得更加谨慎，独立实验室需要拓宽其资本基础。我们预计2026年会出现更多创新的融资结构，包括更多地依赖债务融资。我们也预计至少有一家实验室会提交上市申请。如果这些融资渠道受限，那么行业整合就成为更可能的结果。在这种情况下，收购方可能来自下游，比如缺乏前沿模型能力、寻求垂直整合的玩家。

非语言模型的发展速度将超过大语言模型。我们的分析显示，自2023年以来，大约三分之二的AI风投资金都集中在以LLM为中心的技术上。随着语言模型进展放缓，我们预计下一波重大突破将来自非语言模态，比如物理世界模型、时间序列模型和科学基础模型。这些领域的主要瓶颈是数据稀缺，使得数据生成和收集成为首要挑战。

数据，而非算法创新，将成为模型性能最重要的决定因素。维持前沿进步需要获取更大量、更高质量的特定领域数据，这些数据越来越多地来自真实世界和专有来源。已经有一些快速成长的初创公司涉足这一领域，我们预计未来会涌现出新一波创业公司。

成本将变得重要得多。随着AI周期进入第二阶段，成本开始变得至关重要。企业AI预算会趋于平缓，迫使公司从现有预算中挤出更多价值。因此，模型选择正日益从一个纯技术决策转变为一个财务决策。成本压力将有利于推理效率，而非训练突破，并鼓励对开源模型进行更多实验。长期来看，模型层的利润率可能会被压缩，促使模型公司向应用层延伸。

应用层：价值之所在

在大多数科技周期中，最终的价值都流向了应用层。在互联网时代，谷歌、亚马逊和Facebook等公司通过为用户提供获取信息、购物和社交的全新方式，创造了巨大的价值。AI周期也会遵循类似的模式。虽然基础设施和模型提供了基础框架，但长期价值将归于那些能从根本上改变人们生活和工作方式的AI应用公司。

在企业端，今天的AI如此强大的原因，归结为两个根本性的突破：

第一，用自然语言作为主要用户界面，重新定义了工作流程。LLM让我们可以从复杂的多步骤工作流程，转向简单的意图驱动指令。用户可以不再强迫自己将目标翻译成深奥的机器逻辑，而是直接用自然语言表达需求。编码Agent就是一个明显的例子：开发者可以用日常英语描述期望的结果，然后让Agent自动生成和测试代码。这不仅改变了工程师的工作方式，也拓宽了能够构建软件的人群范围，让非工程师也能成为产品构建者。

第二，从“记录系统”迈向“智能系统”。今天的AI应用通常是基于现有的CRM、ERP等“记录系统”之上。但AI的出现，让企业有机会建立一个全新的系统。之所以有可能，是因为AI能够跨多个系统、跨时间维度，对海量的非结构化数据进行推理，从而揭示单个系统无法展示出的上下文信息。例如，销售洞察、客户支持数据和产品决策，这些以往孤立在不同系统的信息，AI可以作为一个统一的推理层，将它们串联起来，产生巨大的商业价值。

为什么AI原生公司比SaaS公司扩张更快？

根据分析，AI原生公司比传统SaaS公司的扩张速度快了50%。我们认为这背后有几大结构性变化和利好因素：

明确、可衡量的投资回报率。AI原生应用通常能带来清晰、即时的回报。它们部署于高价值的特定痛点，价值立竿见影。比如，利用AI撰写专利的初创公司，通过将专利撰写时间缩短80%，让律师能够承接更多客户，直接转化为更高的收入。其价值主张明确、量化，买方很容易证明其合理性。

自下而上的采用方式。传统SaaS往往是自上而下的决策。而AI原生应用通常先被个人用户或团队采用，然后才扩展到企业级部署。这使得许多AI应用初创公司可以从产品驱动的个人用户模式入手，缩短变&现周期。

运营效率。AI原生初创公司可以用更小的团队达到可观的规模。虽然“一人独角兽公司”的想法可能过于极端，但整体前提是成立的。我们有家投资组合公司从第一天起就实现了盈利，并通过自然增长雇佣了数万名付费用户。数据分析显示，一些AI公司人均创收可高达250万美元。

不断增长的企业预算。研究表明，2025年企业AI预算同比增长了约200%，预计2026年还将再增长约75%。许多企业现在都设立了专门的创新预算用于AI试点项目。挑战在于，预算的快速扩张催生了广泛的实验：企业同时在测试大量AI解决方案。因此，在评估AI初创公司时，必须区分其收入是可持续的经常性收入，还是短期的项目性收入。

数据来源: A16z

需要强调的一点是，并非所有AI应用初创公司都能平等地受益于这些趋势。我们发现，最成功的AI应用公司，并不是在模型本身的智能水平上进行竞争。相反，它们胜在能将产品与可衡量的业务成果挂钩，并持续优化工作流程和用户体验。虽然通用型领域也涌现了一些出色的赢家，但典型的突破性AI应用初创公司往往更加聚焦。它们瞄准特定的横向或纵向痛点，深度嵌入现有工作流程，解决用户频繁遇到的问题，从而形成习惯性使用。

流行编码与多模态内容生成之年

2025年，一些AI应用类别实现了突破。它们的共同特征包括：解决高频、高价值的任务；在具有明确成功/失败信号和反馈循环的领域运作；系统能够以低成本容忍偶尔的错误。

编码。编码领域在2025年迅速爆发，由Replit、Cursor和Lovable等公司引领。“流行编码”一词进入了大众词汇，其中几家公司的增长速度已跻身软件行业历史前列。

法律。法律已成为生成式AI应用最契合的领域之一，Harvey、EvenUp、Spellbook和Solve Intelligence等公司增长迅猛。该领域非常适合，因为法律工作主要由大量非结构化文本构成，且工作价值极高。即使是适度的生产力提升，也能为用户带来显著的投资回报。

多模态内容生成。内容生成也经历了类似的发展轨迹，在创作者和营销人员中得到了迅速采用。HeyGen、Higgsfield、Creatify和OpenArt等平台通过将AI直接嵌入多媒体创意工作流程，实现了快速增长。

展望2026年，我们预计还会有几个新的突破性类别出现：

客户支持。客户支持代表着一个巨大但尚未完全爆发的机会。随着Agent可靠性的提高和语音AI的成熟，我们预计采用率将加速。

传统行业的垂直Agent。我们预计新一波垂直初创公司将更深入地嵌入传统行业的工作流程。医疗保健、制造业、保险和资产管理等行业仍高度依赖人工和流程驱动，为能够自动化特定领域工作流程的垂直Agent创造了沃土。

科学AI（2026年以后）。长期来看，我们预计科学AI将从研究走向实际应用。随着基础模型的改进，在药物发现和材料科学等领域，AI的采用将会加速。

Agent AI：长期的奖赏

Agent AI代表了应用层最雄心勃勃的机会。未来将是一个充满AI Agent的世界，它们能够推理复杂环境、与其他Agent协调、并自主执行多步骤工作流程。重要的是，这个机遇之所以如此强大，不仅仅是因为Agent能够采取行动，而是因为它们能够同时在海量非结构化数据上进行推理，连接以前孤立的概念，并在时间和变化条件下维持上下文。自主行动形成了闭环，但最终让Agent与传统自动化区分开来的，是其卓越的推理能力，而非执行能力。

挑战在于，支撑Agent的基础设施仍不成熟。因此，尽管备受期待，今天的Agent系统仍处于早期、脆弱且分布不均的状态。过去一年，出现了像MCP、A2A和A2P这样的新协议，旨在让Agent更方便地使用工具、相互交流和处理事务。其中，MCP是目前最成熟、采用最广泛的协议。同时，生态系统的碎片化问题依然存在。因此，今天的大多数Agent仍然是辅助性的副驾驶，而非真正的自动化Agent。目前的两个主要瓶颈是长期规划和记忆/状态管理。因此，Agent在不同领域的采用将是不均衡的。我们预计，内部运营和后台工作流程中的Agent用例将率先成熟。

如果有一天Agent变得足够可靠，其影响将是深远的。AI将从增强/替代5000亿美元的软件市场，转向碘伏10万亿美元的服务市场。鉴于这个机遇的巨大规模，我们预计每个主要实验室和科技公司都会积极竞争，以抢占Agent层。最近的一些动向，如Meta收购Manus AI，都彰显了Agent在战略上的重要性。

Translink Capital的Agent分类法

2026年预测：应用层

边缘AI将从中试走向生产部署。小语言模型和边缘硬件性能的提升，意味着现在非常小的模型也能拥有强大的能力。因此，推理正在日益向数据产生的地方迁移，尤其是对于延迟敏感和安全敏感的工作负载。

机器人技术持续获得动力，但仍受瓶颈限制。我们认为机器人的“ChatGPT时刻”终将到来，但可能还有几年之遥。一个关键问题是，机器人的胜利路径将是硬件优先还是软件优先。无论哪种方式占主导，真正的瓶颈依然存在，尤其是在真实环境中的数据收集和灵巧操作方面。因此，进展将是不均衡的。我们预计，2026年在受控的企业环境中会有更多部署，但更广泛的消费级应用尚需时日。

我们处在AI泡沫中吗？

这个话题在今天不可避免地会被提起。正如霍华德·马克斯在其备忘录中所指出的，并非所有的泡沫都一样。有些主要由投机和杠杆驱动，而另一些则由真正的技术拐点驱动。本轮周期显然属于后者。话虽如此，但市场确实也出现了一些过热的迹象。一些AI初创公司的估值与基本面严重脱节，生态系统中也存在大量的资金循环。这些动态可能导致市场过度膨胀。

一个AI泡沫最终形成并破裂，是有可能的。但我们不认为这个拐点会在2026年到来。理由如下：投资规模相对于机会仍然较小；技术投资周期很长；大型科技公司对AI的承诺依然坚定。综合来看，尽管市场存在一些泡沫化迹象，但AI周期尚未进入晚期阶段。因此，我们预计更可能的是间歇性的估值回调，而非全面的崩盘。

我们2026年的关注重点

展望未来，我们的关注点深受贯穿本报告的一个观察所影响：AI的进步不再受制于原始模型智能，而是受制于系统、数据和混乱的现实世界集成。

第一，在基础设施方面，我们正在寻找能够解锁系统级瓶颈的初创公司。随着瓶颈从芯片转向系统，那些能提高系统级可靠性和利用率的公司将迎来机遇。

第二，我们仍然关注数据基础设施，特别是新颖的数据收集方法。随着模型成熟，获取高质量、特定领域和真实世界的数据正成为差异化的主要驱动力。

第三，我们花更多时间在Agent基础设施上，包括记忆和安全。随着Agent从演示进入生产环境，这些能力正成为企业采用的关键因素。

第四，我们越来越关注能够支撑新“智能系统”的垂直Agent。

第五，随着语言模型成熟，我们预计更多创新将来自非语言模态。

最后，边缘AI仍然是我们感兴趣的领域。随着成本压力增加，以及延迟、安全性和可靠性变得更重要，推理正在向数据产生的地方迁移。包括机器人在内的边缘部署，代表了AI价值创造中不断增长的一部分。

如果你正在以上任何一个领域进行建设，我们非常期待与你交流。