法国8人团队在半年内打造的开源AI模型Moshi惊艳登场,其实时原生多模态功能媲美GPT-4o,演示几乎零延迟,引发AI界热议。Moshi可理解情感、支持多种语言和风格,能同时处理音频流,展示了低至160ms的端到端延迟。模型训练使用了70亿参数,包括Helium合成的文本数据和真人配音,且可在消费级硬件上运行。尽管仍存在质疑,但Moshi的开源和本地部署特性备受关注。kyutai实验室,一个6人初创团队,凭借杰出的学术背景和3亿欧元融资,致力于开放科学,推动AI技术进步。
原文链接
本文链接:https://kx.umi6.com/article/2666.html
转载请注明文章出处
相关推荐
.png)
换一换
抢先OpenAI发布Her,马斯克围观的端到端实时音频模型,前FAIR团队创业打造
2024-07-05 21:58:23
成立半年就敢踢馆 OpenAI ,首个开源模型不输 GPT-4o,LeCun 、PyTorch 之父齐声叫好
2024-07-06 04:11:19
比GPT-4o更早,最强实时多模态模型来了,8人团队6个月搞定
2024-07-05 20:37:46
开源版《Her》来了,技术报告已公开!大神Karpathy:它很有个性
2024-09-19 15:13:18
8人半年肝出开源版GPT-4o,0延迟演示全网沸腾,背后技术揭秘,人人免费用
2024-07-04 17:41:52
法国AI实验室Kyutai演示语音助理Moshi 挑战ChatGPT
2024-07-04 00:57:10
全国人大常委会法工委:网络安全法拟增加促进AI安全与发展内容
2025-10-23 18:13:26
OpenAI:欧洲业务增长强劲 将继续加大投入
2025-10-24 00:18:56
《GTA6》电臀舞玩法被辟谣:网友瞎编的 结果谷歌AI全信了
2025-10-22 18:52:05
400万日活,2500万用户,1.3亿美元:LiblibAI拿到今年国内AI应用最大一笔钱
2025-10-23 08:59:30
华为正式发布HarmonyOS 6,10月22日开启公测
2025-10-22 18:49:40
“超级周期”持续演绎 三星和SK海力士将内存价格上调30%
2025-10-23 13:08:10
1.3亿美元!LiblibAI拿下国内AI应用赛道年度最大融资
2025-10-23 15:06:43
554 文章
293648 浏览
24小时热文
更多

-
2025-10-24 01:20:07
-
2025-10-24 00:18:56
-
2025-10-23 21:15:29