恰逢Google翻译上线二十周年,谷歌推出全新音频翻译模型Gemini 3.5 Live Translate,搭载七十余种语言的实时语音翻译能力,为跨语言沟通场景带来AI升级。
该模型面向广大开发者开放接入渠道,可搭建低延迟的近实时语音翻译服务,适配的落地场景覆盖多维度,跨国远程通话、多语种商务会议、外语线上课程、公共广播实时口译等场景都能匹配使用。依托Gemini大模型底层架构,实时转译对口语对话、专业领域话术的语义理解、语序还原表现都得到优化,减少生硬直译的问题。
Google翻译本身拥有庞大的用户体量,官方信息显示每月有超十亿用户依靠这款工具完成各类翻译需求。日常大家常用的拍照译文字、短句文本互译、双人面对面实时对话翻译都是核心使用场景,而全新的Gemini 3.5 Live Translate模型,会同步赋能翻译App里的Live translate实时对话功能,提升对话翻译的流畅度与响应速度。
从App界面截图可以看到新版Google翻译的简洁布局,页面设有文本输入区,底部清晰划分实时对话翻译、相机拍照翻译、语言学习练习三大功能入口,搭配一键语音输入按钮,双语语种切换操作简单易懂。回望二十年迭代历程,谷歌翻译从基础文字互译,一步步拓展出离线翻译包、实景相机翻译、双人对话翻译,如今升级到大模型驱动的实时语音口译,进化路线贴合大众与行业的双重需求。