2025年AI反向传播算法TOP5深度对比

2026-06-01阅读 0热度 0
Back
好的,没问题。作为一名深耕科技投资领域的专家,我很乐意帮你把这份干货满满的行业分析,打磨成一篇既有专业深度又富有阅读节奏的文章。 以下是经过人性化重写后的版本:

2025年AI领域的进展,很大程度上是2024年就已经显现的诸多趋势的延续和深化。在2024年底,我们就曾指出,以DeepSeek和Qwen为代表的中国模型,正成为其西方同行不可忽视的竞争者。与此同时,推理能力的提升和“计算机使用”功能的出现,催生了一个全新的概念——AI Agent。这些进步背后,是对大规模AI基础设施投资的高速增长。而这些主题,都毫无意外地延续到了2025年。

真正让2025年变得与众不同的,是这些趋势推进的速度和规模。整个行业的AI资本支出(CapEx)达到了4000亿美元,几乎是前一年的两倍。在应用层,像Manus、Cursor和Lovable这样的公司,在短短数月内,就从双位数的ARR(年经常性收入)规模,飙升至数亿美元,这在科技行业的历史上堪称前所未有。与此同时,中国的开源大语言模型(LLM)在各大开源榜单上占据了主导地位。

2025年并没有太多本质上的范式革新,更多的是对已有趋势的验证和加速,将原本需要多年才能走完的发展历程,压缩在了一年之内完成。下面,我们就来回顾一下这一年的进展,并展望一下2026年。

基础设施层:从芯片瓶颈到系统瓶颈

如果要一句话总结AI基础设施层面正在发生的变化,那就是:芯片层面的瓶颈,正在让位于系统层面的瓶颈。所谓的“系统层面”,指的是那些支撑芯片大规模运行的外围设施——网络、电力传输、冷却系统、数据中心基础设施,以及最终的能源本身。早在2025年4月,埃隆·马斯克就曾表达过类似的观点。

我们绝不是暗示英伟达、AMD或博通这样的芯片巨头会变得无关紧要。实际上,从我们自己的渠道调研来看,最新一代芯片的供应依然紧张。但这意味着,能源安全和韧性将成为一个更重要的议题。当长期瓶颈日益向能源转移时,像中国这样在这方面拥有结构性优势的国家,将比美国等国家获得相对优势(如下图所示)。

2025 AI BACKWARD PASS

数据来源: Our World in Data

我们仍处于早期到中期的阶段

尽管2025年投入了约4000亿美元的巨额资本支出,但多项信号表明,未来的路还很长。

首先,回顾以往的技术周期,如铁路、电话和互联网,资本支出平均需要10到20年才能达到顶峰。以互联网投资周期为例,它始于90年代初,直到2000年才达到峰值,最终以互联网泡沫破裂告终。如果我们把ChatGPT的发布视为本周期“iPhone时刻”的起点,那么我们现在才刚刚走了四年。

2025 AI BACKWARD PASS

数据来源: 旧金山联邦储备银&行

其次,目前全球只有约5%的数据中心容量是GPU或AI驱动的。绝大部分现有数据中心仍基于CPU,为传统的非AI工作负载优化。如果我们相信未来大多数数据中心最终都需要支持AI工作负载,那么这场转型才刚刚开始。

第三,像谷歌、微软、亚马逊和Meta这样的科技巨头,它们合计占据了超过90%的AI资本支出,并继续将AI视为关乎其存亡的战略优先事项。从高管的言论中,几乎看不出有削减支出的迹象。或许更重要的是,投资者对此也一直保持支持。谷歌的股票在2026年上涨了65%,很大程度上得益于Gemini 3的成功发布及其在AI领域的强势回归。这些因素都表明,AI军备竞赛依然如火如荼,竞争的紧迫性还没有被资本支出的纪律所取代。

然而,一些早期的裂痕也开始显现。AI云服务提供商CoreWea ve的股价在上市后一度涨至发行价的4倍以上,但随后大幅回撤。同样,甲骨文(Oracle)在与OpenAI高调宣布合作后股价飙升了150%,但之后也从高点回落了超过30%。这些波动表明,尽管投资者总体上仍对AI交易持支持态度,但市场已出现了一些早期的谨慎信号。

在我们看来,基础设施层的市场情绪,越来越取决于像OpenAI和Anthropic这些基础模型实验室自身的财务健康状况和可持续性。例如,甲骨文约5000亿美元的总履约义务中,大约有60%与OpenAI绑定。任何对这些实验室偿付能力或可持续性的质疑,都可能在更广泛的生态系统中引起连锁反应。但只要这些实验室还能不断找到资金来源,基础设施层的系统性风险就大概率是可控的。

2026年预测:基础设施层

2026年不会达到投资顶峰,但增速将开始放缓。英伟达仍然是整体基础设施支出的一个有效风向标。尽管这家芯片制造商的增长速度依然强劲,但其营收增速已从之前90%的峰值有所回落。正如前面提到的,我们才刚刚进入当前投资周期的第四年。不过,我们认为这个周期会比以往的技术周期更短,因为AI的投资回报路径更清晰、更快速。在互联网时代,由于网络效应的存在,你必须先建立一个庞大的用户基础,技术才能变得有用。AI则不同,它能即时提供价值,一个用户就能从ChatGPT中获得巨大收益。因此,投资回报率更清晰,收入增长更快,资本投入也更快。

硬件/芯片层将出现更多元化的选择。英伟达仍然是芯片制造商中毋庸置疑的“800磅大猩猩”,但其利润率实在太高了,以至于这个行业不可能永远不被碘伏。一些可靠的替代方案已经开始出现,比如谷歌TPU的性能提升。同样,AMD的数据中心业务也持续向好。芯片层面的多元化,对整个生态系统来说应当是件好事,它会导致企业和消费者的价格下降,并加速AI的普及。

数据中心建设将面临重大延误。今年有本好书叫《Breakneck》。书中作者提出,美国的精英多是律师,而中国的精英则更多是工程师。这带来的实际影响是,美国系统在结构上更倾向于风险规避和流程管控,而非快速建设。事实上,我们在美国公共和私营部门都已经看到了这种动态。我们预计,同样的结构性摩擦也将减缓大规模数据中心的建设进程。这再次印证了,系统层面的瓶颈将可能制约AI发展的速度。

内存和存储将变得越来越重要。AI Agent需要是有状态的,换句话说,它们需要记住东西。每次Agent学习、回忆或交互,都会产生需要存储的新数据。这些数据可以是文本形式,但未来会越来越多模态化和基于行为交互。因此,内存,或者说存储,是累积且不断叠加的瓶颈。相比之下,计算是短暂的,可以在一个推理任务完成后被回收用于下一个任务。如何更有效地存储和检索信息,是一个值得深思的问题。

模型层:中国作为碘伏者

2025年的第一个重大事件是2025年1月DeepSeek R1的发布。虽然我们在2024年就已经预见到了中国大语言模型的崛起,但DeepSeek R1模型的能力还是让我们自己感到惊讶。它的核心创新在于,证明了强大的推理能力可以通过大规模强化学习,在“后训练”阶段利用激进的推理时计算扩展来实现,而不仅仅依赖于更大的预训练模型。

2025 AI BACKWARD PASS

摘自我们2024年的年度回顾

R1的发布引发了市场剧烈反应,英伟达股价单日下跌15%。投资者将其解读为,未来的模型性能可能不再需要大规模的蛮力计算,因此也不需要那么多GPU了。但这种观点忽略了非常重要的一点:那些减少训练需求的同一套技术,同样也会增加推理需求。

回到中国的话题上,我们认为需要问两个关键问题:中国开源模型会持续追赶西方的闭源模型吗?以及,中国模型会对西方造成大规模的碘伏吗?

对于第一个问题,我们的看法是,短期内中国模型很难达到最先进的水平,主要受限于硬件层。DeepSeek展示了中国在算法和训练创新上的强大竞争力,但今天的顶尖模型仍然高度依赖最先进的芯片。巧妇难为无米之炊。中国模型的持久优势在于成本-性能比。如果能源成为AI的长期主要瓶颈,那么中国凭借其大规模且成本更低的能源供应,完全有能力实现单位推理能耗成本最低。长远来看,如果国内硬件也赶上来,算法创新和能源优势的结合,有可能让中国实验室在前沿领域一较高下。但这条路可能还比较漫长。

对于第二个问题,我们认为中国模型的威胁在企业端要高于消费端。在消费端,一个中国模型公司单纯通过聊天机器人挑战ChatGPT或Gemini的可能性不大。不过,就像TikTok碘伏社交媒体一样,一个中国的消费级AI应用,而非模型本身,仍有可能随着时间的推移获得巨大市场影响力。在企业端,情况则有所不同。这里,成本和单位经济模型更为重要,中国开源模型能够提供令人心动的成本优势。对于上层的AI应用公司来说,它们的利润率直接与Token和API成本挂钩,推理成本的任何降低都会直接改善其利润表。有传言称,一些西方的应用公司已经开始微调中国模型。趋势也印证了这一点,Hugging Face上中国模型的下载量已经超过了美国模型。

2025 AI BACKWARD PASS

数据来源: State of AI

谷歌的逆袭

2025年,我们还看到了领先大模型提供商之间市场份额的重大转移。Anthropic在企业市场份额上已经超过了OpenAI,而谷歌在CEO桑达尔·皮查伊于2023年初下达“红色代码”后,也基本追上了AI竞赛的步伐。这迫使萨姆·奥尔特曼在2025年底也发布了自己的“红色代码”。

2025 AI BACKWARD PASS

数据来源: Menlo Ventures

我们非常看好谷歌在AI竞赛中的地位。首先,垂直整合让他们能拥有更多技术栈,减少利润向英伟达等芯片制造商和基础设施供应商的流失。其次,强大的自由现金流让他们能维持激进的定价策略。第三,可能也是最重要的一点,谷歌的数据优势无人能及,它在搜索、地图、邮箱、文档、YouTube、照片、安卓等领域积累了数十年的多模态用户数据。这种多样性产生了更丰富的预训练语料库,带来了更好的模型泛化能力。

这些优势赋予了谷歌将价格大幅下压的选项。虽然它目前还没这么做,但一旦做了,就会给其他独立模型实验室带来额外的压力。我们认为,谷歌最终会成为这一层的价格制定者,而其他公司则只能被迫跟随。

相比之下,像OpenAI这样的创业公司处境则更复杂一些。它们一方面要同时向投资者展示盈利路径,另一方面还要继续筹集数千亿美元来保持在技术前沿的竞争力。外部估计显示,OpenAI可能要到2030年才能盈利,而Anthropic可能会更早,在2027-2028年左右实现盈亏平衡。

最终,这些独立实验室的命运不仅取决于自身的执行力,也取决于投资者的持续信念,以及谷歌、微软等巨头们的战略选择。它们有一个重要的优势,就是它们在整个生态系统中的核心地位:包括英伟达和甲骨文在内的大量行业参与者,在经济上都依赖于它们的持续成功,这为它们提供了一种隐性的战略支持。

2025 AI BACKWARD PASS

数据来源: The Information

2026年预测:模型层

至少有一家主要实验室会寻求上市或被收购。前沿模型开发越来越取决于资本的可获得性。随着一级市场投资者对AI交易变得更加谨慎,独立实验室需要拓宽其资本基础。我们预计2026年会出现更多创新的融资结构,包括更多地依赖债务融资。我们也预计至少有一家实验室会提交上市申请。如果这些融资渠道受限,那么行业整合就成为更可能的结果。在这种情况下,收购方可能来自下游,比如缺乏前沿模型能力、寻求垂直整合的玩家。

非语言模型的发展速度将超过大语言模型。我们的分析显示,自2023年以来,大约三分之二的AI风投资金都集中在以LLM为中心的技术上。随着语言模型进展放缓,我们预计下一波重大突破将来自非语言模态,比如物理世界模型、时间序列模型和科学基础模型。这些领域的主要瓶颈是数据稀缺,使得数据生成和收集成为首要挑战。

数据,而非算法创新,将成为模型性能最重要的决定因素。维持前沿进步需要获取更大量、更高质量的特定领域数据,这些数据越来越多地来自真实世界和专有来源。已经有一些快速成长的初创公司涉足这一领域,我们预计未来会涌现出新一波创业公司。

成本将变得重要得多。随着AI周期进入第二阶段,成本开始变得至关重要。企业AI预算会趋于平缓,迫使公司从现有预算中挤出更多价值。因此,模型选择正日益从一个纯技术决策转变为一个财务决策。成本压力将有利于推理效率,而非训练突破,并鼓励对开源模型进行更多实验。长期来看,模型层的利润率可能会被压缩,促使模型公司向应用层延伸。

应用层:价值之所在

在大多数科技周期中,最终的价值都流向了应用层。在互联网时代,谷歌、亚马逊和Facebook等公司通过为用户提供获取信息、购物和社交的全新方式,创造了巨大的价值。AI周期也会遵循类似的模式。虽然基础设施和模型提供了基础框架,但长期价值将归于那些能从根本上改变人们生活和工作方式的AI应用公司。

在企业端,今天的AI如此强大的原因,归结为两个根本性的突破:

第一,用自然语言作为主要用户界面,重新定义了工作流程。LLM让我们可以从复杂的多步骤工作流程,转向简单的意图驱动指令。用户可以不再强迫自己将目标翻译成深奥的机器逻辑,而是直接用自然语言表达需求。编码Agent就是一个明显的例子:开发者可以用日常英语描述期望的结果,然后让Agent自动生成和测试代码。这不仅改变了工程师的工作方式,也拓宽了能够构建软件的人群范围,让非工程师也能成为产品构建者。

第二,从“记录系统”迈向“智能系统”。今天的AI应用通常是基于现有的CRM、ERP等“记录系统”之上。但AI的出现,让企业有机会建立一个全新的系统。之所以有可能,是因为AI能够跨多个系统、跨时间维度,对海量的非结构化数据进行推理,从而揭示单个系统无法展示出的上下文信息。例如,销售洞察、客户支持数据和产品决策,这些以往孤立在不同系统的信息,AI可以作为一个统一的推理层,将它们串联起来,产生巨大的商业价值。

为什么AI原生公司比SaaS公司扩张更快?

根据分析,AI原生公司比传统SaaS公司的扩张速度快了50%。我们认为这背后有几大结构性变化和利好因素:

明确、可衡量的投资回报率。AI原生应用通常能带来清晰、即时的回报。它们部署于高价值的特定痛点,价值立竿见影。比如,利用AI撰写专利的初创公司,通过将专利撰写时间缩短80%,让律师能够承接更多客户,直接转化为更高的收入。其价值主张明确、量化,买方很容易证明其合理性。

自下而上的采用方式。传统SaaS往往是自上而下的决策。而AI原生应用通常先被个人用户或团队采用,然后才扩展到企业级部署。这使得许多AI应用初创公司可以从产品驱动的个人用户模式入手,缩短变&现周期。

运营效率。AI原生初创公司可以用更小的团队达到可观的规模。虽然“一人独角兽公司”的想法可能过于极端,但整体前提是成立的。我们有家投资组合公司从第一天起就实现了盈利,并通过自然增长雇佣了数万名付费用户。数据分析显示,一些AI公司人均创收可高达250万美元。

不断增长的企业预算。研究表明,2025年企业AI预算同比增长了约200%,预计2026年还将再增长约75%。许多企业现在都设立了专门的创新预算用于AI试点项目。挑战在于,预算的快速扩张催生了广泛的实验:企业同时在测试大量AI解决方案。因此,在评估AI初创公司时,必须区分其收入是可持续的经常性收入,还是短期的项目性收入。

2025 AI BACKWARD PASS

数据来源: A16z

需要强调的一点是,并非所有AI应用初创公司都能平等地受益于这些趋势。我们发现,最成功的AI应用公司,并不是在模型本身的智能水平上进行竞争。相反,它们胜在能将产品与可衡量的业务成果挂钩,并持续优化工作流程和用户体验。虽然通用型领域也涌现了一些出色的赢家,但典型的突破性AI应用初创公司往往更加聚焦。它们瞄准特定的横向或纵向痛点,深度嵌入现有工作流程,解决用户频繁遇到的问题,从而形成习惯性使用。

流行编码与多模态内容生成之年

2025年,一些AI应用类别实现了突破。它们的共同特征包括:解决高频、高价值的任务;在具有明确成功/失败信号和反馈循环的领域运作;系统能够以低成本容忍偶尔的错误。

编码。编码领域在2025年迅速爆发,由Replit、Cursor和Lovable等公司引领。“流行编码”一词进入了大众词汇,其中几家公司的增长速度已跻身软件行业历史前列。

法律。法律已成为生成式AI应用最契合的领域之一,Harvey、EvenUp、Spellbook和Solve Intelligence等公司增长迅猛。该领域非常适合,因为法律工作主要由大量非结构化文本构成,且工作价值极高。即使是适度的生产力提升,也能为用户带来显著的投资回报。

多模态内容生成。内容生成也经历了类似的发展轨迹,在创作者和营销人员中得到了迅速采用。HeyGen、Higgsfield、Creatify和OpenArt等平台通过将AI直接嵌入多媒体创意工作流程,实现了快速增长。

展望2026年,我们预计还会有几个新的突破性类别出现:

客户支持。客户支持代表着一个巨大但尚未完全爆发的机会。随着Agent可靠性的提高和语音AI的成熟,我们预计采用率将加速。

传统行业的垂直Agent。我们预计新一波垂直初创公司将更深入地嵌入传统行业的工作流程。医疗保健、制造业、保险和资产管理等行业仍高度依赖人工和流程驱动,为能够自动化特定领域工作流程的垂直Agent创造了沃土。

科学AI(2026年以后)。长期来看,我们预计科学AI将从研究走向实际应用。随着基础模型的改进,在药物发现和材料科学等领域,AI的采用将会加速。

Agent AI:长期的奖赏

Agent AI代表了应用层最雄心勃勃的机会。未来将是一个充满AI Agent的世界,它们能够推理复杂环境、与其他Agent协调、并自主执行多步骤工作流程。重要的是,这个机遇之所以如此强大,不仅仅是因为Agent能够采取行动,而是因为它们能够同时在海量非结构化数据上进行推理,连接以前孤立的概念,并在时间和变化条件下维持上下文。自主行动形成了闭环,但最终让Agent与传统自动化区分开来的,是其卓越的推理能力,而非执行能力。

挑战在于,支撑Agent的基础设施仍不成熟。因此,尽管备受期待,今天的Agent系统仍处于早期、脆弱且分布不均的状态。过去一年,出现了像MCP、A2A和A2P这样的新协议,旨在让Agent更方便地使用工具、相互交流和处理事务。其中,MCP是目前最成熟、采用最广泛的协议。同时,生态系统的碎片化问题依然存在。因此,今天的大多数Agent仍然是辅助性的副驾驶,而非真正的自动化Agent。目前的两个主要瓶颈是长期规划和记忆/状态管理。因此,Agent在不同领域的采用将是不均衡的。我们预计,内部运营和后台工作流程中的Agent用例将率先成熟。

如果有一天Agent变得足够可靠,其影响将是深远的。AI将从增强/替代5000亿美元的软件市场,转向碘伏10万亿美元的服务市场。鉴于这个机遇的巨大规模,我们预计每个主要实验室和科技公司都会积极竞争,以抢占Agent层。最近的一些动向,如Meta收购Manus AI,都彰显了Agent在战略上的重要性。

2025 AI BACKWARD PASS

Translink Capital的Agent分类法

2026年预测:应用层

边缘AI将从中试走向生产部署。小语言模型和边缘硬件性能的提升,意味着现在非常小的模型也能拥有强大的能力。因此,推理正在日益向数据产生的地方迁移,尤其是对于延迟敏感和安全敏感的工作负载。

机器人技术持续获得动力,但仍受瓶颈限制。我们认为机器人的“ChatGPT时刻”终将到来,但可能还有几年之遥。一个关键问题是,机器人的胜利路径将是硬件优先还是软件优先。无论哪种方式占主导,真正的瓶颈依然存在,尤其是在真实环境中的数据收集和灵巧操作方面。因此,进展将是不均衡的。我们预计,2026年在受控的企业环境中会有更多部署,但更广泛的消费级应用尚需时日。

我们处在AI泡沫中吗?

这个话题在今天不可避免地会被提起。正如霍华德·马克斯在其备忘录中所指出的,并非所有的泡沫都一样。有些主要由投机和杠杆驱动,而另一些则由真正的技术拐点驱动。本轮周期显然属于后者。话虽如此,但市场确实也出现了一些过热的迹象。一些AI初创公司的估值与基本面严重脱节,生态系统中也存在大量的资金循环。这些动态可能导致市场过度膨胀。

一个AI泡沫最终形成并破裂,是有可能的。但我们不认为这个拐点会在2026年到来。理由如下:投资规模相对于机会仍然较小;技术投资周期很长;大型科技公司对AI的承诺依然坚定。综合来看,尽管市场存在一些泡沫化迹象,但AI周期尚未进入晚期阶段。因此,我们预计更可能的是间歇性的估值回调,而非全面的崩盘。

我们2026年的关注重点

展望未来,我们的关注点深受贯穿本报告的一个观察所影响:AI的进步不再受制于原始模型智能,而是受制于系统、数据和混乱的现实世界集成。

第一,在基础设施方面,我们正在寻找能够解锁系统级瓶颈的初创公司。随着瓶颈从芯片转向系统,那些能提高系统级可靠性和利用率的公司将迎来机遇。

第二,我们仍然关注数据基础设施,特别是新颖的数据收集方法。随着模型成熟,获取高质量、特定领域和真实世界的数据正成为差异化的主要驱动力。

第三,我们花更多时间在Agent基础设施上,包括记忆和安全。随着Agent从演示进入生产环境,这些能力正成为企业采用的关键因素。

第四,我们越来越关注能够支撑新“智能系统”的垂直Agent

第五,随着语言模型成熟,我们预计更多创新将来自非语言模态

最后,边缘AI仍然是我们感兴趣的领域。随着成本压力增加,以及延迟、安全性和可靠性变得更重要,推理正在向数据产生的地方迁移。包括机器人在内的边缘部署,代表了AI价值创造中不断增长的一部分。

如果你正在以上任何一个领域进行建设,我们非常期待与你交流。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策