
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
标题:多模态长文档新基准LongDocURL发布,GPT-4o刚及格
GPT-4o仅得分64.5,其余模型均未及格。LongDocURL评测集全面评估多模态长文档理解能力,涵盖20项细粒度任务,包括长文档理解、数值推理和跨元素定位。
LongDocURL专注于50至150页的英文文档,平均页数和文档...
原文链接
加载更多

暂无内容