人工智能在跨语种交流方面又向前迈进了一步。6月9日,谷歌正式发布全新的 Gemini 3.5 实时翻译模型,希望借助更强大的音频处理能力,进一步消除不同语言之间的沟通障碍。
作为谷歌在实时语音到语音(Speech-to-Speech)翻译领域的全新成果,该模型最突出的特点是出色的识别与还原表现。按照谷歌官方的说法,Gemini 3.5 可以自动识别全球70多种语言,不仅覆盖常见语种,也能为更多场景下的即时交流带来支持。
相比传统翻译工具,这款模型的一大看点在于它能够尽量保留说话方式本身的特点。在进行实时翻译时,它不只关注内容是否准确、表达是否顺畅,还能同步还原说话者原有的语气、语速和音高变化。也就是说,跨语言沟通不再只是生硬的内容转换,而会更接近一场带有个人情绪和表达风格的自然对话。
目前,这项技术已经开始进入实际应用阶段。据了解,谷歌正在把它逐步接入自家的多个产品体系中。随着这一模型进一步推广,未来用户在更多国际交流场景里,或将感受到更加自然、顺畅的实时互译体验。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END

















用户38505528 9个月前0
粘贴不了啊用户12648782 10个月前0
用法杂不对呢?yfarer 10个月前0
草稿id无法下载,是什么问题?