1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:Nature重磅:AI实现101种语言的语音互译

Meta开发的开源多语言、多模态机器翻译模型SeamlessM4T,实现了100多种语言在语音-语音、语音-文本和文本-语音方面的高效翻译。该模型能将任何一种语言的文本或语音输入翻译成36种语言的语音。

SeamlessM4T在处理语音到文本任务时,抗噪能力和适应说话者变化的能力比其他系统高出约50%,展现了强大的鲁棒性。塔林理工大学教授Tanel Alumäe评价称,此模型有望媲美科幻作品中的技术,并强调其数据和代码可公开获取。

当前,Meta基于UnitY2架构,训练出了SeamlessM4T V2,保持高准确率的同时加快了生成语音和文本翻译结果的速度。SeamlessM4T通过新的语言识别模型,识别100多种语言,并构建了包含37种语言、时长超47万小时的SeamlessAlign语料库。

在多个翻译任务中,SeamlessM4T表现显著优于传统级联系统。此外,SeamlessM4T在抗噪声和适应说话人变化方面也实现了技术突破。然而,该工具在处理俚语、专有名词及语音韵律和情感表达方面仍有局限性。

原文链接
本文链接:https://kx.umi6.com/article/11763.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
腾讯打响AI抢人大战!首次拿出数百万巨额奖金及Offer办算法大赛
2025-06-16 17:11:49
多家科创板公司释放中报预增信号:AI成电子产业增长关键词 创新成果及募投项目效益显现
2025-07-02 21:45:15
皮克斯首席创意官谈 AI:目前尚无法让自己感到惊艳,甚至“很无聊”
2025-07-06 19:17:42
24小时热文
更多
扫一扫体验小程序