1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

3月17日,小米大模型团队宣布在音频推理领域取得重大突破,受DeepSeek-R1启发,他们将强化学习算法应用于多模态音频理解任务,仅用一周时间就以64.5%的准确率登顶国际权威MMAU音频理解评测榜首。MMAU评测集通过复杂任务评估模型的推理能力,目前该榜单第一名为商业闭源模型GPT-4o,准确率为57.3%。小米团队使用Qwen2-Audio-7B模型,结合清华大学的AVQA数据集,通过强化学习微调实现显著性能提升。实验表明,强化学习方法在小数据集上优于传统监督学习,且7B参数模型同样能展现强大推理能力。小米已开源相关代码、模型参数和技术报告,推动学术与产业交流。

原文链接
本文链接:https://kx.umi6.com/article/15559.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Claude 4如何思考?资深研究员回应:RLVR已在编程/数学得到验证
2025-05-24 15:19:19
OpenAI总裁透露GPT-5改了推理范式,AGI实现要靠现实反馈
2025-08-18 17:48:45
Thinking Machine新研究刷屏!结合RL+微调,小模型训练更具性价比
2025-10-28 10:41:47
强化学习之于 AI Agent,是灵魂、还是包袱?
2025-04-23 11:56:20
从蛰伏到王炸,RL启示录
2025-03-25 19:11:14
全新合成框架SOTA:强化学习当引擎,任务合成当燃料,蚂蚁港大联合出品
2025-10-01 18:47:16
4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦
2025-07-09 15:04:14
混元OCR模型核心技术揭秘:统一框架、真端到端
2025-11-30 11:05:21
Epoch AI 预言:最快 1 年内,推理模型步伐将放缓
2025-05-14 09:09:06
Gemini2.5弯道超车背后的灵魂人物
2025-06-05 11:52:48
我们让GPT玩狼人杀,它特别喜欢杀0号和1号,为什么?
2025-05-23 13:51:09
DeepSeek登《Nature》封面,梁文锋带队,首次回应争议
2025-09-18 13:54:10
奥尔特曼:感受不到 GPT-5 变强,是因为你还不够「专业」
2025-10-05 20:24:55
24小时热文
更多
扫一扫体验小程序