抢先OpenAI发布Her，马斯克围观的端到端实时音频模型，前FAIR团队创业打造

2024-07-05 21:58:23

新智燎原

发布在

快讯

阅读：942

法国创业团队Kyutai，由前FAIR团队成员创立，于近期抢先发布实时音频模型Moshi，马斯克亲自围观。Moshi是一款端到端的、能表达70种情绪和风格的AI，支持700ms内响应，能进行语音合成并引发互动，如模仿不同口音和讲故事。模型开源且免费，旨在提供低延迟的用户体验。尽管存在一些小问题，如在Mac上偶现错误，但Moshi展示了强大的潜力。OpenAI的ChatGPT语音助手则因安全原因推迟发布，预计还需一个月。网友们已经开始试用Moshi，引发热烈讨论。

原文链接

本文链接：https://kx.umi6.com/article/2769.html

转载请注明文章出处

Kyutai