法国8人团队在半年内打造的开源AI模型Moshi惊艳登场,其实时原生多模态功能媲美GPT-4o,演示几乎零延迟,引发AI界热议。Moshi可理解情感、支持多种语言和风格,能同时处理音频流,展示了低至160ms的端到端延迟。模型训练使用了70亿参数,包括Helium合成的文本数据和真人配音,且可在消费级硬件上运行。尽管仍存在质疑,但Moshi的开源和本地部署特性备受关注。kyutai实验室,一个6人初创团队,凭借杰出的学术背景和3亿欧元融资,致力于开放科学,推动AI技术进步。
原文链接
本文链接:https://kx.umi6.com/article/2666.html
转载请注明文章出处
相关推荐
换一换
成立半年就敢踢馆 OpenAI ,首个开源模型不输 GPT-4o,LeCun 、PyTorch 之父齐声叫好
2024-07-06 04:11:19
比GPT-4o更早,最强实时多模态模型来了,8人团队6个月搞定
2024-07-05 20:37:46
开源版《Her》来了,技术报告已公开!大神Karpathy:它很有个性
2024-09-19 15:13:18
8人半年肝出开源版GPT-4o,0延迟演示全网沸腾,背后技术揭秘,人人免费用
2024-07-04 17:41:52
法国AI实验室Kyutai演示语音助理Moshi 挑战ChatGPT
2024-07-04 00:57:10
抢先OpenAI发布Her,马斯克围观的端到端实时音频模型,前FAIR团队创业打造
2024-07-05 21:58:23
科创引领新经济 数智驱动新发展——2025东方财富私募风云际会论坛盛大召开
2025-12-08 15:32:36
机构:2026年全球800G以上光收发模块达近6300万组
2025-12-08 17:39:25
智元第 5000 台人形机器人“灵犀 X2”量产下线,已具备批量出货能力
2025-12-08 17:37:43
Sensor Tower:2025 谷歌 Gemini 强势上位,三项核心 AI 增长指标反超 ChatGPT
2025-12-06 15:35:30
Meta 签约多家媒体,为 Meta AI 聊天机器人带来更多新闻内容
2025-12-08 12:27:32
SpaceX据称拟按8000亿美元估值出售内部股份
2025-12-06 03:08:19
英国拟全面推广 AI 人脸识别系统,但黑人、亚裔“极易”被误报为涉案人员
2025-12-06 16:38:53
601 文章
381384 浏览
24小时热文
更多
-
2025-12-08 18:41:52 -
2025-12-08 18:40:45 -
2025-12-08 18:40:02