谷歌Gemini 3.5 Live Translate翻译App深度测评

2026-06-10阅读 0热度 0
Gemini

谷歌于今晚正式发布全新实时语音互译音频模型——Gemini 3.5 Live Translate。此前的翻译工具普遍采用“用户说完、系统再翻”的串行流程,而新模型真正突破了实时翻译的技术瓶颈。

Gemini 3.5 Live Translate 可自动识别70余种语言,并生成流畅自然的翻译语音。其核心亮点在于:完整保留说话者原有的语调、语速及音高。用户听到的不再是机械合成音,而是高度贴近原声的“口译版本”。


实现“实时”的关键技术在于:传统轮流式系统需要等待整句话结束才开始翻译,容易造成尴尬停顿;Gemini 3.5 Live Translate 采用连续语音生成机制,一边积累更多上下文来优化翻译精度,一边即时输出翻译以匹配说话者的节奏。整个对话中翻译音频始终保持流畅,通常仅比原声延迟数秒,几乎无感知。

即日起,Gemini 3.5 Live Translate 将逐步登陆谷歌多个产品生态:

开发者可通过 Gemini Live API 及 Google AI Studio 获取公开预览版;企业客户本月起可在 Google Meet 中体验私有预览版;普通用户则可通过 Android 与 iOS 版谷歌翻译直接使用。

该模型在语音流式传输中同步处理内容,自动应对多语言输入,无需手动切换语言设置。抗噪能力经过专项优化,可在嘈杂、复杂甚至不可预测的环境下稳定运行。开发者可将其集成至多语言通话、线上会议、在线课程、直播及广播等场景,实现真正的实时口译体验。

对普通用户而言,Gemini 3.5 Live Translate 将登陆全球 Android 与 iOS 版谷歌翻译应用。使用实时翻译功能时,只需连接任意耳机,即可在70余种语言中获得更流畅的翻译体验,且译文语音更贴近说话者的语气。

此外,Android 用户还将获得基于 3.5 Live Translate 的全新“聆听模式”。用户可将手机像接电话一样贴近耳边,直接通过听筒收听翻译音频。若未携带耳机且不希望旁人听到翻译内容,该模式尤为实用。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策