新代码暗示 OpenAI 本月 24 日推出 ChatGPT AI 高级语音模式
科技媒体爆新料:OpenAI或于本月底正式推出ChatGPT高级语音模式
昨天,科技圈又被一条消息刷了屏。知名科技媒体 testingcatalog 在9月18日发布博文爆料,OpenAI 公司很有可能在 9 月 24 日,对 ChatGPT 的高级语音模式进行一次更大范围的推广,甚至不排除是直接正式发布。
要知道,OpenAI 在今年 7 月才首次向一小部分 ChatGPT Plus 用户开放了这个高级语音模式的测试。那一次,用户算是真正领教了 GPT-4o 模型带来的、近乎真人般的音频响应体验。这才过去两个多月,就有新动作了?速度确实不一般。
testingcatalog 的报道并非空xue来风。他们的依据是,OpenAI 公司已经悄然更新了高级语音模式的 FAQ 页面。有眼尖的开发者在页面代码里发现了一个关键字符串:“hasSeenAdvancedVoice/2024-09-24”。这行代码的指向性很明确,暗示 OpenAI 可能会在本月 24 号那天,邀请一批移动端用户体验这个高级功能。
无独有偶,在 macOS 版的 ChatGPT 应用上,也出现了一些值得玩味的变化。最直观的改动在语音模式的交互界面:原来那个大家熟悉的、代表 ChatGPT 语音的静态黑色圆形图标,已经被替换掉了。新图标变成了一幅会随语音播放而动态流动的天空动画,视觉上更具沉浸感。
除了“换皮肤”,功能入口也在优化。现在,语音页面上新增了一个按钮,方便用户快速访问语音选择功能。不过眼下,可供选择的语音仍然只有四种。但请注意这个界面的设计——它明显为未来容纳更多语音选项预留了空间。这与之前的内部报告内容对得上,报告里早就提到 OpenAI 内部测试的语音数量远不止四个,只是多数仍在完善中,尚未开放。
更有意思的细节还在后面。一些技术爱好者继续深挖那个 FAQ 页面,发现了另一段说明文字:
We are enabling Voice chat access to memories to a small number of alpha Advanced Voice users.
翻译过来意思很明确:“我们已向少数 Alpha 高级语音用户启用语音聊天访问记忆的权限”。
这句话信息量不小。它意味着,部分顶尖测试用户已经可以体验“语音对话调用记忆”这个功能了。这可不是简单的语音聊天,而是让 AI 能在语音交互中,记住并调用之前的对话上下文,从而让多轮语音交流更像人与人之间的自然对话。如果这项能力随着高级语音模式一同铺开,那用户体验的升级将是跨越式的。
综合这些线索来看,9月24日这个日期确实越来越值得关注。从内部代码到客户端界面更新,再到新功能的有限测试,一切都指向 OpenAI 正在为一项重要的发布做最后准备。当然,最终是扩大测试范围还是全面上线,还得等官方揭晓答案。但可以确定的是,AI语音交互的竞争,马上就要进入一个新阶段了。

