法国创业团队Kyutai,由前FAIR团队成员创立,于近期抢先发布实时音频模型Moshi,马斯克亲自围观。Moshi是一款端到端的、能表达70种情绪和风格的AI,支持700ms内响应,能进行语音合成并引发互动,如模仿不同口音和讲故事。模型开源且免费,旨在提供低延迟的用户体验。尽管存在一些小问题,如在Mac上偶现错误,但Moshi展示了强大的潜力。OpenAI的ChatGPT语音助手则因安全原因推迟发布,预计还需一个月。网友们已经开始试用Moshi,引发热烈讨论。
原文链接
本文链接:https://kx.umi6.com/article/2769.html
转载请注明文章出处
相关推荐
.png)
换一换
法国AI实验室Kyutai演示语音助理Moshi 挑战ChatGPT
2024-07-04 00:57:10
开源版《Her》来了,技术报告已公开!大神Karpathy:它很有个性
2024-09-19 15:13:18
比GPT-4o更早,最强实时多模态模型来了,8人团队6个月搞定
2024-07-05 20:37:46
成立半年就敢踢馆 OpenAI ,首个开源模型不输 GPT-4o,LeCun 、PyTorch 之父齐声叫好
2024-07-06 04:11:19
8人半年肝出开源版GPT-4o,0延迟演示全网沸腾,背后技术揭秘,人人免费用
2024-07-04 17:41:52
抢先OpenAI发布Her,马斯克围观的端到端实时音频模型,前FAIR团队创业打造
2024-07-05 21:58:23
荣耀设立20亿激励资源 提升智能体和MagicOS生态体验力度
2025-10-23 18:14:34
OpenAI收购由前苹果员工创立的人工智能初创公司
2025-10-24 01:20:07
网易云信10周年宣布品牌升级,从“基础通信管道”到“AI交互引擎”
2025-10-23 15:10:38
智谱运气是差一点点,视觉Token研究又和DeepSeek撞车了
2025-10-23 15:07:10
华为正式发布HarmonyOS 6,10月22日开启公测
2025-10-22 18:49:40
阿里巴巴将开启夸克AI眼镜预售 推动人工智能应用商业化
2025-10-23 13:08:00
对冲基金大佬对AI热潮“敬而远之”,更青睐这项技术……
2025-10-23 16:10:22
579 文章
290845 浏览
24小时热文
更多

-
2025-10-24 01:20:07
-
2025-10-24 00:18:56
-
2025-10-23 21:15:29