正文:2025年7月25日,蚂蚁数科在WAIC前夕发布了金融推理大模型Agentar-Fin-R1,并上线相关论文。该模型基于Qwen3,提供8B和32B两个版本,在金融领域测评集(如Fineva、FinEval等)及通用推理基准(MATH、GPQA)中刷新SOTA,超越DeepSeek-R1、GPT-o1等模型。研究团队通过专业金融数据标签体系、加权训练算法等创新方法优化模型性能,兼顾金融专业化与通用能力。同时,蚂蚁数科提出新评测基准Finova,包含1350道难题,从智能体能力、复杂推理、安全合规三方面评估模型,Agentar-Fin-R1-32B以69.93分领先。作为蚂蚁集团科技商业化板块,蚂蚁数科长期深耕金融AI,服务国有银行、城商行及数百家机构,推动行业数智化转型。
原文链接
本文链接:https://kx.umi6.com/article/22348.html
转载请注明文章出处
相关推荐
换一换
蚂蚁数科正式发布金融推理大模型
2025-07-28 12:15:04
金融智能体进入规模落地期 蚂蚁数科被评综合领导者
2025-12-11 18:05:30
基于通义千问 Qwen3 研发,蚂蚁数科发布金融推理大模型 Agentar-Fin-R1
2025-07-28 13:10:29
蚂蚁发布EnergyTS能源电力大模型 预测精度远超谷歌、亚马逊
2025-03-26 18:06:12
太火了!我在外滩大会玩Deepfake,想骗过机器人结果……
2024-09-07 14:01:51
蚂蚁数科发布智能体开发平台Agentar 金融机构可“零代码”搭建专业智能体应用
2025-04-30 18:53:01
蚂蚁数科发布EnergyTS 2.0:以更高精度预测助力企业降低用能成本
2025-09-19 16:16:38
蚂蚁数科金融大模型技术领先 评测效果超主流开源模型
2025-06-19 16:51:45
蚂蚁数科企业级AI产品全线出海,首次在海外市场展现全栈产品矩阵
2025-05-14 12:11:52
全国首个金融大模型成绩单:服务超2亿用户8大应用场景
2024-12-06 16:26:54
基于通义千问 Qwen3 研发,蚂蚁数科发布金融推理大模型 Agentar-Fin-R1
2025-07-28 13:10:29
蚂蚁数科CTO王维:可信智能体已成产业规模化应用AI必需基础设施
2025-03-28 15:51:18
蚂蚁数科发布金融推理大模型,助力金融机构加速落地智能体应用
2025-07-28 14:13:59
682 文章
525373 浏览
24小时热文
更多
-
2026-04-24 18:31:29 -
2026-04-24 18:30:24 -
2026-04-24 18:29:17