1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

3月17日,小米大模型团队宣布在音频推理领域取得重大突破,受DeepSeek-R1启发,他们将强化学习算法应用于多模态音频理解任务,仅用一周时间就以64.5%的准确率登顶国际权威MMAU音频理解评测榜首。MMAU评测集通过复杂任务评估模型的推理能力,目前该榜单第一名为商业闭源模型GPT-4o,准确率为57.3%。小米团队使用Qwen2-Audio-7B模型,结合清华大学的AVQA数据集,通过强化学习微调实现显著性能提升。实验表明,强化学习方法在小数据集上优于传统监督学习,且7B参数模型同样能展现强大推理能力。小米已开源相关代码、模型参数和技术报告,推动学术与产业交流。

原文链接
本文链接:https://kx.umi6.com/article/15559.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
QwenLong-L1-32B 模型登场:阿里通义千问首个强化学习训练的长文本推理 AI 模型
2025-05-27 14:51:28
DeepSeek首登《自然》封面:中国大模型创造新历史,做了OpenAI不敢做的事
2025-09-18 16:58:59
4o-mini华人领队也离职了,这次不怪小扎
2025-08-19 16:01:05
OpenAI路线遭质疑,Meta研究员:根本无法构建超级智能
2025-06-20 21:05:08
8块钱跑通一次强化学习全流程,潞晨云重塑微调赛道:1名算法工程师=1支Infra团队
2026-01-07 16:15:48
AI Agent 发展史:从 RL 驱动到大模型驱动 |AIR 2025
2025-04-09 21:08:08
DeepSeek登《Nature》封面,梁文锋带队,首次回应争议
2025-09-18 13:54:10
字节&MAP重塑大模型推理算法优化重点,强化学习重在高效探索助力LLM提升上限
2025-08-11 10:59:04
受 DeepSeek-R1 启发,小米大模型团队登顶音频推理 MMAU 榜
2025-03-17 12:37:44
OpenAI:GPT-5 模型正开始减轻科学家日常工作量
2025-11-22 00:51:13
又一篇“苦涩的教训”,让AI觉得人间有不值,发现无穷尽
2025-04-22 08:10:09
2025年图灵奖:强化学习的前世今生
2025-04-01 10:19:18
带图推理碾压同类开源模型!港中文微软等开源OpenThinkIMG框架
2025-05-17 13:06:23
24小时热文
更多
扫一扫体验小程序