综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
标题:中科院自动化所推出多图数学推理新基准MV-MATH
挑战多图数学推理新基准,大模型表现不佳?
近日,中国科学院自动化研究所推出多图数学推理数据集MV-MATH,旨在全面评估多模态大语言模型在多视觉场景中的数学推理能力。
结果显示,GPT-4o得分为32.1,类o1模型QvQ得分29.3,所有模...
原文链接
加载更多
暂无内容