谷歌Gemini 3.5 Live Translate翻译App深度测评

2026-06-10阅读 0热度 0

Gemini

谷歌于今晚正式发布全新实时语音互译音频模型——Gemini 3.5 Live Translate。此前的翻译工具普遍采用“用户说完、系统再翻”的串行流程，而新模型真正突破了实时翻译的技术瓶颈。

Gemini 3.5 Live Translate 可自动识别70余种语言，并生成流畅自然的翻译语音。其核心亮点在于：完整保留说话者原有的语调、语速及音高。用户听到的不再是机械合成音，而是高度贴近原声的“口译版本”。

实现“实时”的关键技术在于：传统轮流式系统需要等待整句话结束才开始翻译，容易造成尴尬停顿；Gemini 3.5 Live Translate 采用连续语音生成机制，一边积累更多上下文来优化翻译精度，一边即时输出翻译以匹配说话者的节奏。整个对话中翻译音频始终保持流畅，通常仅比原声延迟数秒，几乎无感知。

即日起，Gemini 3.5 Live Translate 将逐步登陆谷歌多个产品生态：

开发者可通过 Gemini Live API 及 Google AI Studio 获取公开预览版；企业客户本月起可在 Google Meet 中体验私有预览版；普通用户则可通过 Android 与 iOS 版谷歌翻译直接使用。

该模型在语音流式传输中同步处理内容，自动应对多语言输入，无需手动切换语言设置。抗噪能力经过专项优化，可在嘈杂、复杂甚至不可预测的环境下稳定运行。开发者可将其集成至多语言通话、线上会议、在线课程、直播及广播等场景，实现真正的实时口译体验。

对普通用户而言，Gemini 3.5 Live Translate 将登陆全球 Android 与 iOS 版谷歌翻译应用。使用实时翻译功能时，只需连接任意耳机，即可在70余种语言中获得更流畅的翻译体验，且译文语音更贴近说话者的语气。

此外，Android 用户还将获得基于 3.5 Live Translate 的全新“聆听模式”。用户可将手机像接电话一样贴近耳边，直接通过听筒收听翻译音频。若未携带耳机且不希望旁人听到翻译内容，该模式尤为实用。

谷歌Gemini 3.5 Live Translate翻译App深度测评

相关阅读

最新教程

最新资讯