谷歌翻译迎来20周年,Gemini 3.5 Live Translate实时翻译模型正式发布

月下琴音 · 发表于前天 18:53

恰逢Google翻译上线二十周年，谷歌推出全新音频翻译模型Gemini 3.5 Live Translate，搭载七十余种语言的实时语音翻译能力，为跨语言沟通场景带来AI升级。
该模型面向广大开发者开放接入渠道，可搭建低延迟的近实时语音翻译服务，适配的落地场景覆盖多维度，跨国远程通话、多语种商务会议、外语线上课程、公共广播实时口译等场景都能匹配使用。依托Gemini大模型底层架构，实时转译对口语对话、专业领域话术的语义理解、语序还原表现都得到优化，减少生硬直译的问题。

Google翻译本身拥有庞大的用户体量，官方信息显示每月有超十亿用户依靠这款工具完成各类翻译需求。日常大家常用的拍照译文字、短句文本互译、双人面对面实时对话翻译都是核心使用场景，而全新的Gemini 3.5 Live Translate模型，会同步赋能翻译App里的Live translate实时对话功能，提升对话翻译的流畅度与响应速度。
从App界面截图可以看到新版Google翻译的简洁布局，页面设有文本输入区，底部清晰划分实时对话翻译、相机拍照翻译、语言学习练习三大功能入口，搭配一键语音输入按钮，双语语种切换操作简单易懂。回望二十年迭代历程，谷歌翻译从基础文字互译，一步步拓展出离线翻译包、实景相机翻译、双人对话翻译，如今升级到大模型驱动的实时语音口译，进化路线贴合大众与行业的双重需求。

普通用户后续会在Google翻译App里逐步体验到新模型带来的翻译优化，出境交流、跨境线上聊天的实时翻译体验会更顺滑；对于软件、平台开发者来说，标准化模型接口可以快速集成到办公软件、通讯应用、教学平台中，大幅降低自研多语言实时口译功能的开发难度。