以文本翻译见长的 AI 公司 DeepL 正在拓展其产品能力,推出实时语音翻译功能,进一步进入语音交互领域。

该功能支持将语音实时转换为另一种语言,并以语音形式输出,可应用于线上会议、面对面交流及客户服务等场景。

目前系统的实现方式仍为“语音→文本→翻译→语音”的流程,但 DeepL 表明,未来将开发端到端模型,直接实现语音到语音的转换,以减少延迟并提升自然度。

在功能设计上,DeepL 还提供多设备接入与多人对话支持,可用于培训、会议等多语言场景。同时,系统支持术语定制,以提升专业领域的翻译准确性。
此次推出语音翻译,被视为 DeepL 从文本翻译向语音 AI 领域的重大延伸。当前,该赛道已有多家企业布局,包括面向通话场景的实时语音处理方案,以及用于视频和内容本地化的语音生成技术。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...