语音AI爆发在即 五大稀缺资源推荐
OpenAI的代码库里悄悄冒出了一个新模型——gpt-bidi-1。名字看着有点绕口,但背后的关键信息很清楚:这个模型将通过双向音频智能技术,给ChatGPT的语音模式来一次全面升级。它是OpenAI上个月刚发布的语音模型GPT-Realtime-2之后,在垂直方向上布的又一颗棋子。
先看几组核心数据,感受一下这个赛道有多热:
- 2026年,全球语音人工智能市场规模预计达到225亿美元,复合年增长率高达34.8%;单是人工智能语音生成器这个细分,2025年市场规模64亿美元,2026年冲到83.7亿美元,远期目标更是直奔713亿美元。
- 高德纳算过一笔账:语音人工智能落地,能给呼叫中心行业省下合计800亿美元的人力成本。另一边,2026年全球人工智能相关支出预计达到2.52万亿美元,同比增长44%;光人工智能领域的资本支出,2026年就可能攀升到5710亿美元。
- 就在最近,一家语音人工智能初创企业完成了1.3亿美元的C轮融资。而OpenAI自己在2026年2月刚拿了新一轮1100亿美元融资,融资前估值7300亿美元,同时还跟Cerebras签了份总规模超100亿美元的合作协议——未来三年内,采购最高750兆瓦的算力资源。
- 再看实体基础设施这边:2025年投向人工智能基础设施的风险投资规模是335亿美元,2026年这个数字有望接近翻倍。
到这里其实已经能看出一个核心矛盾:语音人工智能的实时双向交互,需要毫秒级响应推理算力,单位运行成本远高于文本交互。于是出现了所谓的“充裕-稀缺悖论”:智能模型的能力越来越充裕,但算力、电力以及相关实体基础设施,反而成了结构性稀缺资源。市场现在的认知普遍有点偏——大多数投资者还在盯着语音人工智能应用层的标的,但实际上,真正吃上结构性稀缺红利的,是算力与实体基础设施交叉领域的企业。芯片、数据中心电力供应、服务器冷却与连接设备,这些赛道才是硬核。英伟达、博通和Vertiv,目前稳稳站在这个价值链的顶端。
往远了看,后续语音人工智能交互总量的增长速度,会远远超过模型效率的提升速度。推理成本每降一点,就会刺激出更多使用需求,反过来又推高底层基础设施的建设需求。这一波浪潮,其实还远远没到精彩处。
译文内容由第三方软件翻译。
