Fun-Audio-Chat - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

阿里通义发布端到端语音交互模型 Fun-Audio-Chat，能猜出你的心情

12月23日，阿里通义发布端到端语音交互模型Fun-Audio-Chat，同时开源Fun-Audio-Chat 8B版本。该模型在多个榜单中同尺寸模型排名第一，性能优于GLM4-Voice、Kimi-Audio等竞品。技术亮点包括端到端S2S架构，无需多模块拼接；双分辨率设计降低GPU计算开销近50%；以及基于百万小时多任务数据训练，覆盖真实场景如情感识别和工具调用。Fun-Audio-Chat可感知用户情绪，从语气、语速等细节推测心情，并提供类人化对话体验，还能通过自然语音指令完成复杂任务。项目已上线GitHub、HuggingFace等平台供开发者使用。

原文链接

E-Poet

12-23 18:53:47

Fun-Audio-Chat

情绪识别

端到端语音交互

分享至

打开微信扫一扫

内容投诉

生成图片

阿里发布端到端语音交互模型Fun-Audio-Chat

12月23日，阿里巴巴发布新一代端到端语音交互模型Fun-Audio-Chat，并宣布开源8B模型权重、推理代码及Function Call接入示例。这一模型由通义大模型团队推出，旨在提升语音交互的效率与自然度，为开发者提供更强大的技术支持。此次开源举措将进一步推动语音交互技术的创新与应用落地，助力行业生态发展。

原文链接