12月23日,阿里通义发布端到端语音交互模型Fun-Audio-Chat,同时开源Fun-Audio-Chat 8B版本。该模型在多个榜单中同尺寸模型排名第一,性能优于GLM4-Voice、Kimi-Audio等竞品。技术亮点包括端到端S2S架构,无需多模块拼接;双分辨率设计降低GPU计算开销近50%;以及基于百万小时多任务数据训练,覆盖真实场景如情感识别和工具调用。Fun-Audio-Chat可感知用户情绪,从语气、语速等细节推测心情,并提供类人化对话体验,还能通过自然语音指令完成复杂任务。项目已上线GitHub、HuggingFace等平台供开发者使用。
原文链接
本文链接:https://kx.umi6.com/article/30678.html
转载请注明文章出处
相关推荐
换一换
阿里通义发布端到端语音交互模型 Fun-Audio-Chat,能猜出你的心情
2025-12-23 18:53:47
汤姆猫推出 AI 童伴机器人:支持主动聊天、情绪识别,1499 元起
2024-12-22 23:35:24
汤姆猫首款 AI 机器人产品明日发售,支持情绪识别、主动聊天等
2024-12-20 20:39:31
太逼真!豆包·播客模型来了:一句话生成「苏超联赛」播客,很懂13太保的梗
2025-06-09 17:30:11
阿里发布端到端语音交互模型Fun-Audio-Chat
2025-12-23 17:52:22
养猪业新神器,AI 工具可解读猪叫声背后的情绪
2024-10-30 14:13:05
卡帕西开源Agent自进化训练框架,5分钟一轮实验,48h内揽星9.5k
2026-03-09 15:50:15
清华公布毕业生去向:出国比例仅8.5%,华为字节是最大赢家
2026-03-08 15:07:37
周鸿祎:只有通过多智能体协作 才能让人工智能真正落地
2026-03-07 21:02:28
中东一场无人机轰炸 把全球智力干倒退了?
2026-03-08 07:42:40
美国国防部官员称目前未与Anthropic进行任何实质性谈判
2026-03-06 11:57:53
华泰证券:超配电力链中上游品种 内需与AI是能源之外的主要线索
2026-03-06 20:36:01
超算互联网:OpenClaw正式打通飞书、企业微信
2026-03-09 14:48:46
710 文章
505123 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18