语音AI爆发在即五大稀缺资源推荐

2026-06-23阅读 0热度 0

人工智能

OpenAI的代码库里悄悄冒出了一个新模型——gpt-bidi-1。名字看着有点绕口，但背后的关键信息很清楚：这个模型将通过双向音频智能技术，给ChatGPT的语音模式来一次全面升级。它是OpenAI上个月刚发布的语音模型GPT-Realtime-2之后，在垂直方向上布的又一颗棋子。

先看几组核心数据，感受一下这个赛道有多热：

2026年，全球语音人工智能市场规模预计达到225亿美元，复合年增长率高达34.8%；单是人工智能语音生成器这个细分，2025年市场规模64亿美元，2026年冲到83.7亿美元，远期目标更是直奔713亿美元。
高德纳算过一笔账：语音人工智能落地，能给呼叫中心行业省下合计800亿美元的人力成本。另一边，2026年全球人工智能相关支出预计达到2.52万亿美元，同比增长44%；光人工智能领域的资本支出，2026年就可能攀升到5710亿美元。
就在最近，一家语音人工智能初创企业完成了1.3亿美元的C轮融资。而OpenAI自己在2026年2月刚拿了新一轮1100亿美元融资，融资前估值7300亿美元，同时还跟Cerebras签了份总规模超100亿美元的合作协议——未来三年内，采购最高750兆瓦的算力资源。
再看实体基础设施这边：2025年投向人工智能基础设施的风险投资规模是335亿美元，2026年这个数字有望接近翻倍。

到这里其实已经能看出一个核心矛盾：语音人工智能的实时双向交互，需要毫秒级响应推理算力，单位运行成本远高于文本交互。于是出现了所谓的“充裕-稀缺悖论”：智能模型的能力越来越充裕，但算力、电力以及相关实体基础设施，反而成了结构性稀缺资源。市场现在的认知普遍有点偏——大多数投资者还在盯着语音人工智能应用层的标的，但实际上，真正吃上结构性稀缺红利的，是算力与实体基础设施交叉领域的企业。芯片、数据中心电力供应、服务器冷却与连接设备，这些赛道才是硬核。英伟达、博通和Vertiv，目前稳稳站在这个价值链的顶端。

往远了看，后续语音人工智能交互总量的增长速度，会远远超过模型效率的提升速度。推理成本每降一点，就会刺激出更多使用需求，反过来又推高底层基础设施的建设需求。这一波浪潮，其实还远远没到精彩处。

译文内容由第三方软件翻译。

语音AI爆发在即五大稀缺资源推荐

相关阅读

最新教程

最新资讯