谷歌实时语音互译Gemini 3.5评测:70种语言实测

2026-06-12阅读 0热度 0
Gemini

6月9日消息,北京时间今晚,谷歌正式推出新一代实时语音互译模型——Gemini 3.5 Live Translate。这一步直接补全了实时口译的关键拼图。

谷歌发布实时语音互译模型 Gemini 3.5 Live Translate:可识别 70 余种语言,谷歌翻译 App 就能用

该模型可自动识别超过70种语言,并生成自然流畅的翻译语音,核心亮点在于完整保留说话者原有的语调、语速与音高。这正是它与同类方案拉开差距的关键。

技术层面,传统系统多采用“轮流式”处理:必须等对方说完才能开始翻译,全程存在明显的静默间隔。Gemini 3.5 Live Translate则采用连续语音生成机制,在“等待更多上下文以优化翻译准确性”与“即时跟上说话者节奏”之间找到动态平衡。对话过程中,翻译音频始终保持流畅无中断,仅比原始语音滞后数秒。

产品落地方面,Gemini 3.5 Live Translate即日起逐步部署至谷歌生态:

  • 开发者即日起可在Gemini Live API和Google AI Studio体验公开预览版
  • 企业客户本月起可在Google Meet中申请私有预览权限
  • 普通用户更便捷,直接打开Android或iOS版谷歌翻译App即可使用

该模型在语音流式传输过程中同步处理内容,显著提升跨语言沟通效率。它还能自动应对多语言输入,无需手动切换设置。抗噪能力在嘈杂、复杂甚至不可预测场景中依然可靠。开发者的应用空间广阔:多语言通话、远程会议、视频课程、直播乃至广播场景均可直接接入实时口译能力。

Android用户额外获得专属“聆听模式”。该模式设计非常贴心——用户像接电话一样将手机贴近耳朵,通过听筒直接收听翻译音频。在人多的场合或未戴耳机时,既避免旁人听到翻译内容,又保障隐私,实用性极强。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策