正文:2025年7月25日,蚂蚁数科在WAIC前夕发布了金融推理大模型Agentar-Fin-R1,并上线相关论文。该模型基于Qwen3,提供8B和32B两个版本,在金融领域测评集(如Fineva、FinEval等)及通用推理基准(MATH、GPQA)中刷新SOTA,超越DeepSeek-R1、GPT-o1等模型。研究团队通过专业金融数据标签体系、加权训练算法等创新方法优化模型性能,兼顾金融专业化与通用能力。同时,蚂蚁数科提出新评测基准Finova,包含1350道难题,从智能体能力、复杂推理、安全合规三方面评估模型,Agentar-Fin-R1-32B以69.93分领先。作为蚂蚁集团科技商业化板块,蚂蚁数科长期深耕金融AI,服务国有银行、城商行及数百家机构,推动行业数智化转型。
原文链接
本文链接:https://kx.umi6.com/article/22348.html
转载请注明文章出处
相关推荐
换一换
低调霸榜全球最难SQL榜单超两月,国产AI这次选择高调开源!
2025-12-14 22:01:20
5.31·上海丨华东师大上海人工智能金融学院正式成立!MIT教授Max Tegmark与5 位院士、12 位 人工智能金融顶尖专家齐聚上海,共探 AI-Fin 新机遇
2024-06-07 18:07:57
蚂蚁数科加速推进AI战略,设立“AI+产业创新”实验室
2025-06-10 18:51:29
上海财经大学联合财跃星辰开源首个金融领域R1类推理大模型Fin-R1:仅7B参数,逼近DeepSeek满血版效果
2025-03-21 10:16:47
调查 | 爆火仅半年,DeepSeek在银行业已“泯然众模型”?三大障碍成为拦路虎
2025-08-04 11:56:14
基于通义千问 Qwen3 研发,蚂蚁数科发布金融推理大模型 Agentar-Fin-R1
2025-07-28 13:10:29
全国首个金融大模型成绩单:服务超2亿用户8大应用场景
2024-12-06 16:26:54
蚂蚁数科提出隐私保护AI新算法,可将推理效率提升超过100倍
2025-09-24 15:42:25
香港理工大学与蚂蚁数科共建“AI+Web3联合实验室”
2025-07-29 17:32:16
太火了!我在外滩大会玩Deepfake,想骗过机器人结果……
2024-09-07 14:01:51
蚂蚁数科CTO王维:可信智能体已成产业规模化应用AI必需基础设施
2025-03-28 15:51:18
蚂蚁数科发布智能体开发平台Agentar 金融机构可“零代码”搭建专业智能体应用
2025-04-30 18:53:01
金融智能体进入规模落地期 蚂蚁数科被评综合领导者
2025-12-11 18:05:30
648 文章
442521 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18