综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
12月23日,阿里通义发布端到端语音交互模型Fun-Audio-Chat,同时开源Fun-Audio-Chat 8B版本。该模型在多个榜单中同尺寸模型排名第一,性能优于GLM4-Voice、Kimi-Audio等竞品。技术亮点包括端到端S2S架构,无需多模块拼接;双分辨率设计降低GPU计算开销近50%;以及基于百万小时多任务数据训练,覆盖真实场景如情感识别和工具调用。Fun-Audio-Chat可感知用户情绪,从语气、语速等细节推测心情,并提供类人化对话体验,还能通过自然语音指令完成复杂任务。项目已上线GitHub、HuggingFace等平台供开发者使用。
原文链接
12月23日,阿里巴巴发布新一代端到端语音交互模型Fun-Audio-Chat,并宣布开源8B模型权重、推理代码及Function Call接入示例。这一模型由通义大模型团队推出,旨在提升语音交互的效率与自然度,为开发者提供更强大的技术支持。此次开源举措将进一步推动语音交互技术的创新与应用落地,助力行业生态发展。
原文链接
加载更多
暂无内容