1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

正文:2025年7月25日,蚂蚁数科在WAIC前夕发布了金融推理大模型Agentar-Fin-R1,并上线相关论文。该模型基于Qwen3,提供8B和32B两个版本,在金融领域测评集(如Fineva、FinEval等)及通用推理基准(MATH、GPQA)中刷新SOTA,超越DeepSeek-R1、GPT-o1等模型。研究团队通过专业金融数据标签体系、加权训练算法等创新方法优化模型性能,兼顾金融专业化与通用能力。同时,蚂蚁数科提出新评测基准Finova,包含1350道难题,从智能体能力、复杂推理、安全合规三方面评估模型,Agentar-Fin-R1-32B以69.93分领先。作为蚂蚁集团科技商业化板块,蚂蚁数科长期深耕金融AI,服务国有银行、城商行及数百家机构,推动行业数智化转型。

原文链接
本文链接:https://kx.umi6.com/article/22348.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
上海财经大学联合财跃星辰开源首个金融领域R1类推理大模型Fin-R1:仅7B参数,逼近DeepSeek满血版效果
2025-03-21 10:16:47
蚂蚁发布EnergyTS能源电力大模型 预测精度远超谷歌、亚马逊
2025-03-26 18:06:12
蚂蚁数科金融大模型技术领先 评测效果超主流开源模型
2025-06-19 16:51:45
王小川的百川智能发布全链路领域增强金融大模型,准确率超过GPT-4o
2024-12-23 11:51:58
苏州首个AI数据标注基地投产
2025-07-21 19:24:29
《金融大模型应用评测指南》发布 系全国首个以金融业务能力为核心的团体标准
2024-12-06 17:33:57
太火了!我在外滩大会玩Deepfake,想骗过机器人结果……
2024-09-07 14:01:51
蚂蚁数科发布智能体开发平台Agentar 金融机构可“零代码”搭建专业智能体应用
2025-04-30 18:53:01
百川智能发布全链路领域增强金融大模型 Baichuan4-Finance,测试成绩领先 GPT-4o
2024-12-23 11:53:01
蚂蚁数科CTO王维:可信智能体已成产业规模化应用AI必需基础设施
2025-03-28 15:51:18
金融大模型升级决策平台!马上消费发布天镜3.0破解经验碎片化难题
2025-06-06 23:40:48
WAIC抢先爆料:金融“黑马”大模型超DeepSeek刷新SOTA,论文已上线
2025-07-25 14:24:11
蚂蚁数科加速推进AI战略,设立“AI+产业创新”实验室
2025-06-10 18:51:29
24小时热文
更多
扫一扫体验小程序