12月23日,阿里通义发布端到端语音交互模型Fun-Audio-Chat,同时开源Fun-Audio-Chat 8B版本。该模型在多个榜单中同尺寸模型排名第一,性能优于GLM4-Voice、Kimi-Audio等竞品。技术亮点包括端到端S2S架构,无需多模块拼接;双分辨率设计降低GPU计算开销近50%;以及基于百万小时多任务数据训练,覆盖真实场景如情感识别和工具调用。Fun-Audio-Chat可感知用户情绪,从语气、语速等细节推测心情,并提供类人化对话体验,还能通过自然语音指令完成复杂任务。项目已上线GitHub、HuggingFace等平台供开发者使用。
原文链接
本文链接:https://kx.umi6.com/article/30678.html
转载请注明文章出处
相关推荐
换一换
阿里发布端到端语音交互模型Fun-Audio-Chat
2025-12-23 17:52:22
太逼真!豆包·播客模型来了:一句话生成「苏超联赛」播客,很懂13太保的梗
2025-06-09 17:30:11
汤姆猫首款 AI 机器人产品明日发售,支持情绪识别、主动聊天等
2024-12-20 20:39:31
汤姆猫推出 AI 童伴机器人:支持主动聊天、情绪识别,1499 元起
2024-12-22 23:35:24
养猪业新神器,AI 工具可解读猪叫声背后的情绪
2024-10-30 14:13:05
舔狗AI和被预约的寿司郎
2026-06-05 00:34:31
智启新程 生态同行:2026高通汽车技术与合作峰会展现AI汽车新图景
2026-06-05 19:20:05
从看懂世界到做对动作,卧安机器人OneModel 1.7用一条「隐式通路」打通了具身智能的关键断层
2026-06-03 20:34:55
5分钟AI长视频不翻车!国产开源框架杀到全球第一梯队
2026-06-07 09:22:47
行业景气度走高!SK暂缓出让晶圆厂商SK Siltron
2026-06-04 20:22:35
AI Agent的门票 MiniMax想先打下来
2026-06-04 17:17:31
程序员爆料:Token烧到扛不住 公司全栈AI项目半路夭折
2026-06-03 17:32:02
连GitLab都开始裁程序员了
2026-06-04 17:12:53
774 文章
691825 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41