1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:Nature重磅:AI实现101种语言的语音互译

Meta开发的开源多语言、多模态机器翻译模型SeamlessM4T,实现了100多种语言在语音-语音、语音-文本和文本-语音方面的高效翻译。该模型能将任何一种语言的文本或语音输入翻译成36种语言的语音。

SeamlessM4T在处理语音到文本任务时,抗噪能力和适应说话者变化的能力比其他系统高出约50%,展现了强大的鲁棒性。塔林理工大学教授Tanel Alumäe评价称,此模型有望媲美科幻作品中的技术,并强调其数据和代码可公开获取。

当前,Meta基于UnitY2架构,训练出了SeamlessM4T V2,保持高准确率的同时加快了生成语音和文本翻译结果的速度。SeamlessM4T通过新的语言识别模型,识别100多种语言,并构建了包含37种语言、时长超47万小时的SeamlessAlign语料库。

在多个翻译任务中,SeamlessM4T表现显著优于传统级联系统。此外,SeamlessM4T在抗噪声和适应说话人变化方面也实现了技术突破。然而,该工具在处理俚语、专有名词及语音韵律和情感表达方面仍有局限性。

原文链接
本文链接:https://kx.umi6.com/article/11763.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Figma股价热情仅存1天
2025-08-12 14:18:53
柯洁回应与AI下棋:比一百盘被虐一百盘 AI要我水平低的数据是在污染自己
2025-09-07 09:43:21
AI成“新业务基因”!腾讯半年净赚1034亿 Q2资本开支飙升119%
2025-08-13 22:42:51
高德地图:你用AI骗了我两次
2025-09-16 22:20:43
在这个世界级编程竞赛中,这可能是人类最后一次战胜AI了
2025-07-17 12:24:05
谷歌云 CEO 托马斯・库里安:我不相信 AI 会让所有人的工作都自动化
2025-10-11 13:28:06
搞AI,释永信才是遥遥领先
2025-07-30 12:45:11
钉钉无招:做AI要拒绝傲慢
2025-08-25 17:33:00
谷歌推出AI商务通话功能
2025-07-18 10:38:36
DeepMind掌门人:AI将颠覆制药业,新药研发不再是马拉松
2025-09-12 21:21:22
苹果遭遇AI危机,供应商在逃离“果链”中进退两难
2025-07-21 18:21:33
万亿对决:苹果vs英伟达
2025-08-29 14:41:02
无视GDP:AI的任性崛起
2025-10-03 21:46:48
24小时热文
更多
扫一扫体验小程序