法国8人团队在半年内打造的开源AI模型Moshi惊艳登场,其实时原生多模态功能媲美GPT-4o,演示几乎零延迟,引发AI界热议。Moshi可理解情感、支持多种语言和风格,能同时处理音频流,展示了低至160ms的端到端延迟。模型训练使用了70亿参数,包括Helium合成的文本数据和真人配音,且可在消费级硬件上运行。尽管仍存在质疑,但Moshi的开源和本地部署特性备受关注。kyutai实验室,一个6人初创团队,凭借杰出的学术背景和3亿欧元融资,致力于开放科学,推动AI技术进步。
原文链接
本文链接:https://kx.umi6.com/article/2666.html
转载请注明文章出处
相关推荐
.png)
换一换
开源版《Her》来了,技术报告已公开!大神Karpathy:它很有个性
2024-09-19 15:13:18
抢先OpenAI发布Her,马斯克围观的端到端实时音频模型,前FAIR团队创业打造
2024-07-05 21:58:23
8人半年肝出开源版GPT-4o,0延迟演示全网沸腾,背后技术揭秘,人人免费用
2024-07-04 17:41:52
453 文章
90513 浏览
24小时热文
更多

-
2025-07-19 21:58:20
-
2025-07-19 21:57:13
-
2025-07-19 20:57:00