综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
12月23日,阿里通义发布端到端语音交互模型Fun-Audio-Chat,同时开源Fun-Audio-Chat 8B版本。该模型在多个榜单中同尺寸模型排名第一,性能优于GLM4-Voice、Kimi-Audio等竞品。技术亮点包括端到端S2S架构,无需多模块拼接;双分辨率设计降低GPU计算开销近50%;以及基于百万小时多任务数据训练,覆盖真实场景如情感识别和工具调用。Fun-Audio-Chat可感知用户情绪,从语气、语速等细节推测心情,并提供类人化对话体验,还能通过自然语音指令完成复杂任务。项目已上线GitHub、HuggingFace等平台供开发者使用。
原文链接
12月23日,阿里巴巴发布新一代端到端语音交互模型Fun-Audio-Chat,并宣布开源8B模型权重、推理代码及Function Call接入示例。这一模型由通义大模型团队推出,旨在提升语音交互的效率与自然度,为开发者提供更强大的技术支持。此次开源举措将进一步推动语音交互技术的创新与应用落地,助力行业生态发展。
原文链接
标题:一句话生成播客,豆包·播客模型太逼真了!
家人们,又一款有趣的AI来了——火山引擎发布了豆包·播客模型!只需一句话,就能生成高质量的播客内容。无论是实时热点讲解、超长文本概括,还是开放式话题反应,豆包·播客模型都能轻松应对。
例如,根据“亚朵酒店致歉”生成的播客,AI展现出清晰的态度和专业性;...
原文链接
加载更多
暂无内容