2026年AI算力分配预测:推理占70%,训练仅30%
站在2026年的节点回望,AI的叙事重心,正在发生一场静默但深刻的转移。
当行业的目光仍惯性般聚焦于模型参数竞赛与算力军备时,前沿的观察者已经将视线投向了更底层、也更关乎未来的领域。硅谷 Fusion Fund 创始合伙人张璐在近期的一场行业峰会中,清晰地指出了这一转向:基础设施的“通信层”与物理世界的“数据层”,正成为决定下一轮竞争格局的新战场。
她的判断基于几个关键趋势:推理算力需求即将超越训练,成为耗能主力;数据中心内隐形的通信功耗,可能是计算本身的百倍之巨;而驱动AI进化的核心,将从数据规模转向数据质量。与此同时,医疗、太空与纳米机器人,被标记为最具潜力的应用爆发点。
以下是对其核心观点的系统梳理与解读。
核心观点梳理
- 算力需求的重心正在从训练转向推理:训练是一次性的算力投入,推理才是可持续的长期需求;随着智能体交互替代对话交互,推理算力的比重将从现在的50%继续攀升,成为AI基础设施最核心的优化方向。
- 数据中心的真正电老虎是通信:在AI数据中心内,通信消耗的电量可能比计算本身高出百倍,这意味着光学通信等新一代通信技术的价值,远比通常认知的更为关键。
- 物理AI现在卡在数据层:架构和算力都已具备,真正的瓶颈是缺乏足够高质量的真实世界数据;合成数据可以作为补充,但无法替代边缘场景中的真实采集。
- 数据的质量比数量更重要,而医疗恰恰是高质量数据密度最高的行业之一:这是大量AI科技公司在2025年集中入局医疗赛道的底层逻辑,而不只是因为它市场够大。
- 技术创新只是起点,产业整合速度才是AI落地的真正竞争力:当500强企业的AI预算从千万级跃升至数十亿级,采购周期从半年压缩到一两个月,这种加速度本身就是模型和应用持续迭代的燃料。
AI叙事的新拐点
过去几年,人工智能领域的讨论总是围绕着大语言模型、生成式AI、训练与算力需求这些关键词展开。然而,风向正在微妙地变化。
行业关注的焦点,正从通用大模型转向更垂直的行业专属应用,探讨如何用小语言模型以更低成本、更高效率切入具体产业。模型的对象也在扩展,从纯粹的语言模型,演进到与物理世界交互的物理AI和世界模型。
在计算层面,一个共识逐渐清晰:虽然训练曾消耗了绝大部分算力,但未来推理的需求将持续增长并最终超过训练,成为长期、稳定的算力消耗主体。这背后是应用模式从间歇性对话到持续性智能体服务的根本性转变。
更底层的逻辑变化体现在数据层面。早期信奉的“规模定律”(Scaling Law)强调数据越多越好,而现在,行业更关心数据的质量。如何获取高质量的行业数据,如何进行有效的数据治理(data curation)并构建高质量的“数据图书馆”(data library),以此驱动模型与应用能力的迭代,已成为新的核心议题。
重新定义AI基础设施
基础设施的革新,是支撑上述一切变化的基础。英伟达在GTC大会上将自己重新定义为“人工智能工厂”,这并非偶然,它预示着一场堪比电力普及的基础层产业革命正在发生。
随着AI进入大规模产业部署阶段,新建的数据中心面临严峻挑战,尤其是电力消耗。而这里存在一个常被忽略的真相:耗电的大头可能并非计算本身。
在数据中心内部,通信——包括芯片间、服务器间、集群间的数据搬运——所消耗的能量,根据斯坦福大学前校长、Alphabet董事会主席John Hennessy的观点,可能是计算本身的百倍以上。CPU和GPU的设计哲学本就是尽可能在本地完成计算,因为移动数据的能耗代价远高于移动计算。
这就催生了如光学通信等新技术的价值,它们的目标是大幅降低通信环节的能耗。同时,从语言模型转向物理AI,意味着需要处理更多三维的、来自真实世界的数据,这些数据的体量更大,传输能耗问题也就更加突出。
另一方面,算力需求的结构也在变化。训练可被视为一次性的投入,而推理则是持续性的服务。几年前,训练与推理的算力消耗比可能是7:3,如今已接近5:5,未来很可能演变为3:7。当智能体需要7x24小时在线响应时,如何优化推理算力,就成了基础设施必须解决的核心命题。
物理AI的突围:边缘计算与新型传感器
物理AI的范畴远不止人形机器人,它涵盖了仿真模拟、数据层、世界模型等所有涉及物理世界与AI交互的领域,从无人驾驶、精密制造到医疗、物流乃至太空探索。
目前,物理AI发展的最大瓶颈并非架构或算力,而是数据。我们极度缺乏高质量、高精度的真实世界数据来训练这些模型。尽管合成数据是一个快速发展的补充方向,但它存在固有的盲点,无法完全替代在复杂、动态的边缘场景中采集的真实数据。
因此,创新的焦点需要从模型层,下探到新型数据收集与优化平台。例如,传统制造业沉淀了大量高质量的三维数据,但缺乏标准化、自动化的工具进行采集、清洗和治理,使其难以直接用于AI训练。
这就引出了两个关键趋势:边缘计算与新型传感器。
在边缘端直接进行AI部署和数据处理,能极大减少数据传输需求,并满足高监管行业对数据隐私和实时性的要求。这依赖于模型的小型化,例如已有模型能小到在树莓派上运行,却具备媲美大模型的能力。
同时,像斯坦福大学鲍哲南教授实验室研发的人工皮肤传感器(基于柔性电路技术),代表了新型数据收集平台的突破。这种如手套般轻薄的高精度触觉传感器,能为物理AI提供前所未有的真实世界交互数据。
△来自斯坦福大学官网
△援引自中国科学院学部
值得注意的是,不仅初创公司在此发力,许多制造业龙头企业内部也已启动相关探索,这印证了“数据层是核心瓶颈”已成为产业共识。
关注三个应用方向:医疗、太空与比细胞还小的机器人
在具体的应用赛道上,几个方向呈现出巨大的爆发潜力。
首先是医疗AI。2025年堪称医疗AI的爆发元年。礼来与英伟达的10亿美元合作,ChatGPT、Claude发布医疗专属产品,默克与谷歌Gemini的战略合作,一系列事件标志着AI巨头正密集入局。
△来自英伟达官网
其深层逻辑在于,当数据质量的重要性超越数据规模时,拥有海量、高价值、结构化临床数据的医疗行业,自然成为“富矿”。当下的AI医疗公司,已超越早期的辅助问诊,深入至垂直领域小模型,如针对细胞疗法、特定影像序列或帕金森等疾病的个性化诊断与治疗。物理AI与机器人在医疗中的应用也日趋深入,例如斯坦福背景的Medra公司,正通过AI驱动全自动机器人实验室,碘伏生命科学的研发流程。
其次是太空科技与物理AI的结合。随着SpaceX即将IPO等信号释放,未来3-5年太空经济将快速崛起。太空环境具有天然的“无人化”属性,使得AI与机器人成为基础设施构建、在轨服务(如“太空加油站”)、甚至“太空工厂”运营的核心。这个领域迭代迅速,已有相关企业获得上亿美元级别的订单。
最后是微米/纳米机器人。这是一个需要时间但想象空间巨大的方向。机器人的尺度正在向微观世界进军,例如用于清除血管内血栓的微米机器人已步入商业化初期,而DNA级别的纳米机器人则致力于实现精准的靶向药物递送。这些“体内医生”代表着医疗技术的未来前沿。
纵观这些趋势,一个清晰的结论是:单纯的技术创新已不足以保证领先。真正的竞争力,体现在产业整合的速度上。当大型企业的AI采购预算跃升至数十亿量级,决策周期从数月缩短到数周时,这种来自需求侧的强大拉力,将为AI模型和应用提供快速迭代所必需的场景、反馈与高质量数据,从而形成加速发展的飞轮。
挑战永远与机遇并存。当前AI生态面临的功耗、数据、集成等挑战,恰恰为新一代创业者划定了最具价值的战场。对于观察者和参与者而言,这无疑是一个令人兴奋的时代。