法国创业团队Kyutai,由前FAIR团队成员创立,于近期抢先发布实时音频模型Moshi,马斯克亲自围观。Moshi是一款端到端的、能表达70种情绪和风格的AI,支持700ms内响应,能进行语音合成并引发互动,如模仿不同口音和讲故事。模型开源且免费,旨在提供低延迟的用户体验。尽管存在一些小问题,如在Mac上偶现错误,但Moshi展示了强大的潜力。OpenAI的ChatGPT语音助手则因安全原因推迟发布,预计还需一个月。网友们已经开始试用Moshi,引发热烈讨论。
原文链接
本文链接:https://kx.umi6.com/article/2769.html
转载请注明文章出处
相关推荐
换一换
8人半年肝出开源版GPT-4o,0延迟演示全网沸腾,背后技术揭秘,人人免费用
2024-07-04 17:41:52
法国AI实验室Kyutai演示语音助理Moshi 挑战ChatGPT
2024-07-04 00:57:10
比GPT-4o更早,最强实时多模态模型来了,8人团队6个月搞定
2024-07-05 20:37:46
成立半年就敢踢馆 OpenAI ,首个开源模型不输 GPT-4o,LeCun 、PyTorch 之父齐声叫好
2024-07-06 04:11:19
开源版《Her》来了,技术报告已公开!大神Karpathy:它很有个性
2024-09-19 15:13:18
特斯拉开源硬件,中国公司回应来了:直接把机器人大脑开源了
2026-04-23 09:57:38
仅靠219个字!AI耗时12小时设计出完整CPU:传统研发需18-36个月
2026-04-24 17:26:33
美格智能发布新一代中央计算架构5G舱联AI模组
2026-04-24 15:18:33
荣耀WIN游戏本等多款新品正式发布,荣耀PC家族全面爆发
2026-04-24 17:20:32
阶跃与腾讯云合作打造新一代 AI 座舱解决方案
2026-04-23 19:26:30
Coordination Engineering关键一环,JiuwenClaw再发布Team Skills技能新范式
2026-04-24 15:16:25
Nature封面:机器人乒乓球干翻人类职业选手
2026-04-23 15:11:01
河南师傅,左手扳手,右手飞书,竟然能搞数据分析!
2026-04-23 23:34:55
768 文章
634790 浏览
24小时热文
更多
-
2026-04-25 00:42:43 -
2026-04-24 23:43:31 -
2026-04-24 23:42:26