法国创业团队Kyutai,由前FAIR团队成员创立,于近期抢先发布实时音频模型Moshi,马斯克亲自围观。Moshi是一款端到端的、能表达70种情绪和风格的AI,支持700ms内响应,能进行语音合成并引发互动,如模仿不同口音和讲故事。模型开源且免费,旨在提供低延迟的用户体验。尽管存在一些小问题,如在Mac上偶现错误,但Moshi展示了强大的潜力。OpenAI的ChatGPT语音助手则因安全原因推迟发布,预计还需一个月。网友们已经开始试用Moshi,引发热烈讨论。
原文链接
本文链接:https://kx.umi6.com/article/2769.html
转载请注明文章出处
相关推荐
.png)
换一换
比GPT-4o更早,最强实时多模态模型来了,8人团队6个月搞定
2024-07-05 20:37:46
8人半年肝出开源版GPT-4o,0延迟演示全网沸腾,背后技术揭秘,人人免费用
2024-07-04 17:41:52
成立半年就敢踢馆 OpenAI ,首个开源模型不输 GPT-4o,LeCun 、PyTorch 之父齐声叫好
2024-07-06 04:11:19
法国AI实验室Kyutai演示语音助理Moshi 挑战ChatGPT
2024-07-04 00:57:10
开源版《Her》来了,技术报告已公开!大神Karpathy:它很有个性
2024-09-19 15:13:18
抢先OpenAI发布Her,马斯克围观的端到端实时音频模型,前FAIR团队创业打造
2024-07-05 21:58:23
OpenAI的00后“叛徒”正在碾压华尔街“老江湖”
2025-09-06 16:36:53
黄仁勋的话白说了
2025-09-07 20:49:25
商汤大装置与华为昇腾 384 超节点全面适配,多项创新提升训练效率
2025-09-06 14:35:21
我的宝藏AI 浏览器被43亿“贱卖”了,这可能是最好的结局
2025-09-05 16:22:38
拜拜Claude!阿里最强万亿模型编程秒了Opus4,实测在此
2025-09-06 12:37:03
钉钉与英特尔,共享同一种革命
2025-09-05 14:20:06
华为AI模型运行专利公布
2025-09-05 15:25:04
521 文章
187695 浏览
24小时热文
更多

-
2025-09-07 21:49:50
-
2025-09-07 20:50:36
-
2025-09-07 20:49:25