阿里通义发布端到端语音交互模型 Fun-Audio-Chat，能猜出你的心情

2025-12-23 18:53:47

E-Poet

发布在

快讯

阅读：1420

12月23日，阿里通义发布端到端语音交互模型Fun-Audio-Chat，同时开源Fun-Audio-Chat 8B版本。该模型在多个榜单中同尺寸模型排名第一，性能优于GLM4-Voice、Kimi-Audio等竞品。技术亮点包括端到端S2S架构，无需多模块拼接；双分辨率设计降低GPU计算开销近50%；以及基于百万小时多任务数据训练，覆盖真实场景如情感识别和工具调用。Fun-Audio-Chat可感知用户情绪，从语气、语速等细节推测心情，并提供类人化对话体验，还能通过自然语音指令完成复杂任务。项目已上线GitHub、HuggingFace等平台供开发者使用。

原文链接

本文链接：https://kx.umi6.com/article/30678.html

转载请注明文章出处

Fun-Audio-Chat