墨鱼导航,国内专业的AI工具导航网站!
Ctrl + D 收藏本站
当前位置:首页 » AI行业资讯

字节跳动发布端到端同声传译模型Seed LiveInterpret 2.0,翻译准、延迟低、可复刻声音

Moyuxx 2025-07-25 92

2025 年 7 月 24 日,字节跳动 Seed 团队正式推出端到端同声传译模型 Seed LiveInterpret 2.0。这是首个在翻译准确率、语音延迟与声音复刻三方面同时逼近专业同传表现的产品级中英语音同传系统。

该模型基于全双工端到端语音生成理解框架,支持中英互译,可实时处理多人语音输入。它具备以下优势:
翻译准确率高:在多人会议等复杂场景中,中英双向翻译准确率超 70%,单人演讲翻译准确率超 80%,接近真人专业同传水平。在语音到文本同传任务中,Seed LiveInterpret 2.0 中英互译平均翻译质量的人类评分达到 74.8 分(满分 100),较排名第二的基准系统超出 58%。
语音延迟低:采用全双工语音理解与生成框架,翻译延迟可低至 2 到 3 秒,相比传统机器同传系统平均减少了超过 60% 的等待时间。在语音到语音场景中,输出延时仅 2.53 秒。
0 样本声音复刻:只需采样实时语音信号,便能提取声音特征,用说话人的音色特质实时 “说出” 外语,提升交流的沉浸感和亲和力。
智能平衡节奏:可根据语音清晰度、流畅度、复杂程度,调整输出节奏,并适配不同语言特性,面对超长信息,依然能保证传译语音节奏的自然流畅。
目前,Seed LiveInterpret 2.0 已通过火山引擎开放试用,用户可登录控制台体验语音模型 “Doubao – 同声传译 2.0”。此外,Ola Friend 耳机也计划于 8 月底接入该系统,成为首个支持其语音同传能力的硬件设备。

相关推荐

评论 ( 0 )

回顶部