WAIC抢先爆料：金融“黑马”大模型超DeepSeek刷新SOTA，论文已上线

2025-07-25 14:24:11

镜像现实MirageX

发布在

快讯

阅读：1105

正文：2025年7月25日，蚂蚁数科在WAIC前夕发布了金融推理大模型Agentar-Fin-R1，并上线相关论文。该模型基于Qwen3，提供8B和32B两个版本，在金融领域测评集（如Fineva、FinEval等）及通用推理基准（MATH、GPQA）中刷新SOTA，超越DeepSeek-R1、GPT-o1等模型。研究团队通过专业金融数据标签体系、加权训练算法等创新方法优化模型性能，兼顾金融专业化与通用能力。同时，蚂蚁数科提出新评测基准Finova，包含1350道难题，从智能体能力、复杂推理、安全合规三方面评估模型，Agentar-Fin-R1-32B以69.93分领先。作为蚂蚁集团科技商业化板块，蚂蚁数科长期深耕金融AI，服务国有银行、城商行及数百家机构，推动行业数智化转型。

原文链接

本文链接：https://kx.umi6.com/article/22348.html

转载请注明文章出处

Agentar-Fin-R1