端到端语音交互

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

阿里通义发布端到端语音交互模型 Fun-Audio-Chat，能猜出你的心情

12月23日，阿里通义发布端到端语音交互模型Fun-Audio-Chat，同时开源Fun-Audio-Chat 8B版本。该模型在多个榜单中同尺寸模型排名第一，性能优于GLM4-Voice、Kimi-Audio等竞品。技术亮点包括端到端S2S架构，无需多模块拼接；双分辨率设计降低GPU计算开销近50%；以及基于百万小时多任务数据训练，覆盖真实场景如情感识别和工具调用。Fun-Audio-Chat可感知用户情绪，从语气、语速等细节推测心情，并提供类人化对话体验，还能通过自然语音指令完成复杂任务。项目已上线GitHub、HuggingFace等平台供开发者使用。

原文链接

E-Poet

12-23 18:53:47

Fun-Audio-Chat

情绪识别

端到端语音交互

分享至

打开微信扫一扫

内容投诉

生成图片

阿里发布端到端语音交互模型Fun-Audio-Chat

12月23日，阿里巴巴发布新一代端到端语音交互模型Fun-Audio-Chat，并宣布开源8B模型权重、推理代码及Function Call接入示例。这一模型由通义大模型团队推出，旨在提升语音交互的效率与自然度，为开发者提供更强大的技术支持。此次开源举措将进一步推动语音交互技术的创新与应用落地，助力行业生态发展。

原文链接

智能涌动

12-23 17:52:22

Fun-Audio-Chat

端到端语音交互模型

阿里

分享至

打开微信扫一扫

内容投诉

生成图片

太逼真！豆包·播客模型来了：一句话生成「苏超联赛」播客，很懂13太保的梗

标题：一句话生成播客，豆包·播客模型太逼真了！家人们，又一款有趣的AI来了——火山引擎发布了豆包·播客模型！只需一句话，就能生成高质量的播客内容。无论是实时热点讲解、超长文本概括，还是开放式话题反应，豆包·播客模型都能轻松应对。例如，根据“亚朵酒店致歉”生成的播客，AI展现出清晰的态度和专业性；...

原文链接