1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

近日,随着AI推理模型的兴起,基准测试成本显著上升。据第三方机构“人工智能分析”数据,评估OpenAI的o1推理模型需花费2767.05美元,远高于非推理模型GPT-4o的108.85美元。类似地,Anthropic的Claude 3.7 Sonnet测试成本为1485.35美元,而其非推理版本仅需81.41美元。高昂的成本主要源于推理模型生成大量token,且现代基准测试更复杂,涉及多步骤任务。例如,OpenAI的o1生成超4400万个token,是GPT-4o的八倍。尽管模型性能提升,测试成本仍居高不下。AI初创公司“通用推理”的CEO罗斯·泰勒指出,MMLU Pro测试单次成本已超1800美元。专家警告,免费或补贴的模型测试可能影响评估公正性。截至发稿,相关机构正计划扩大测试预算以应对这一挑战。

原文链接
本文链接:https://kx.umi6.com/article/17078.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
LLM总是把简单任务复杂化,Karpathy无语:有些任务无需那么多思考
2025-08-12 11:21:24
GPT-4o不敌Qwen,无一模型及格!UC伯克利港大等提出多模态新基准
2025-05-16 13:37:28
仅仅一天,Gemini就夺回了GPT-4o拿走的头名
2024-11-22 17:08:30
AI“推理”模型兴起,基准测试成本飙升
2025-04-13 10:34:23
基准测试揭秘大模型“字数危机”:26个模型长文本生成普遍拉胯,最大输出长度过度宣传
2025-05-29 15:34:10
阿里云通义团队发布AI推理模型
2024-11-28 16:33:43
黎曼猜想,AI推理模型的梗
2024-11-18 10:34:12
微软发布 Phi-4 系列小语言 AI 推理模型,AIME 2025 跑分超满血版 Deepseek R1
2025-05-01 16:28:11
开源AI新王被指造假,不要迷信大模型的榜单了
2024-09-11 20:33:28
UL Solutions 推出 AI 文本生成基准测试,支持英伟达、AMD、英特尔三家显卡
2024-12-11 17:33:56
阿联酋推出低成本AI推理模型 宣称“性价比”超同行20倍
2025-09-09 22:23:30
OpenAI o3被曝智商高达157,比肩爱因斯坦,但却没法证明比人类聪明
2024-12-25 18:12:29
“人类终极考试”基准测试发布:顶级 AI 系统表现惨淡,回答准确率均未超 10%
2025-01-24 16:45:09
24小时热文
更多
扫一扫体验小程序