1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

3月17日,小米大模型团队宣布在音频推理领域取得重大突破,受DeepSeek-R1启发,他们将强化学习算法应用于多模态音频理解任务,仅用一周时间就以64.5%的准确率登顶国际权威MMAU音频理解评测榜首。MMAU评测集通过复杂任务评估模型的推理能力,目前该榜单第一名为商业闭源模型GPT-4o,准确率为57.3%。小米团队使用Qwen2-Audio-7B模型,结合清华大学的AVQA数据集,通过强化学习微调实现显著性能提升。实验表明,强化学习方法在小数据集上优于传统监督学习,且7B参数模型同样能展现强大推理能力。小米已开源相关代码、模型参数和技术报告,推动学术与产业交流。

原文链接
本文链接:https://kx.umi6.com/article/15559.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
带图推理碾压同类开源模型!港中文微软等开源OpenThinkIMG框架
2025-05-17 13:06:23
强化学习+MCP=王炸?开源框架教AI在MCP中玩转工具解决任务,实测效果超越GPT!
2025-08-11 09:58:53
波士顿动力 Spot 四足机器人学会连续后空翻,意外让行走姿态更像真实动物
2025-08-28 10:20:06
DeepSeek-R1 论文登上《自然》封面,通讯作者为梁文锋
2025-09-18 09:48:42
DeepSeek登《Nature》封面,梁文锋带队,首次回应争议
2025-09-18 13:54:10
无需外部数据!AI自问自答实现推理能力进化
2025-08-08 16:13:47
Nature封面文章: DeepSeek-R1通过强化学习激励的LLM推理
2025-09-18 08:48:39
4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦
2025-07-09 15:04:14
最新 AGI 暴论:强化学习的「GPT-3 时刻」实现,还需要 1 万年?
2025-07-14 17:29:16
突破多模态奖励瓶颈!中科院清华快手联合提出R1-Reward,用强化学习赋予模型长期推理能力
2025-05-08 18:33:15
我不给人做产品,给Agent做
2025-06-30 08:39:41
字节&MAP重塑大模型推理算法优化重点,强化学习重在高效探索助力LLM提升上限
2025-08-11 10:59:04
OpenAI路线遭质疑,Meta研究员:根本无法构建超级智能
2025-06-20 21:05:08
24小时热文
更多
扫一扫体验小程序