Anthropic发布的Claude Sonnet 5上线仅一日便差评刷屏,核心争议在于“性价比全面翻车”。在硬核逻辑测试中,Sonnet 5的极限分数与Qwen、MiniMax等国产模型打平,但测试成本却高达后者的6倍以上。此外,其Max推理模式易陷入“过度思考”,导致Token消耗暴增,高昂账单已迫使Uber、微软等大厂重新评估或停用。同时,过度保守的安全对齐也使其丧失部分实用价值。尽管Sonnet 5在复杂Agent编程场景表现优异,但在日常推理中,开发者更倾向于选择成本极低的国产大模型。大模型赛道已正式从“拼智商”迈入“拼性价比”的时代。
原文链接
本文链接:https://kx.umi6.com/article/36811.html
转载请注明文章出处
相关推荐
换一换
地球上最聪明的AI!马斯克发布Grok 3:秒杀GPT 超越DeepSeek
2025-02-18 13:21:40
英特尔新显卡拉爆性价比!24GB显存售价3600+,网友:买它
2025-05-20 12:37:54
知识类型视角切入,全面评测图像编辑模型推理能力:所有模型在「程序性推理」方面表现不佳
2025-06-13 15:08:40
OpenAI开源两款gpt-oss系列推理大模型 能力接近o3和o4-mini
2025-08-06 11:30:27
谷歌大模型“性价比之王”来了!混合推理模型,思考深度可自由控制,竞技场排名仅次于自家Pro
2025-04-18 16:14:46
用“草莓”对抗幻觉?OpenAI新项目隐含人工智能升级关键线索
2024-07-13 12:30:05
日本巨头为何纷纷用上中国机器人?
2025-08-14 10:51:47
搅动推理 AI 模型风云:谷歌被曝 1 月 23 日发布增强版 Gemini 2.0 Flash Thinking
2025-01-21 11:36:22
GPT-4.5 性能提升有限、成本却激增 30 倍,OpenAI 面临性价比质疑
2025-03-02 15:40:23
AI进步放缓、遭遇瓶颈?OpenAI等头部公司:不存在
2024-11-29 17:58:36
OpenAI推出全新GPT-4o mini免费上线,2年内GPT大模型成本骤降99%
2024-07-19 08:01:32
Nature:「人类亲吻难题」彻底难倒LLM,所有大模型全部失败!LLM根本不会推理,只是工具
2024-11-18 10:17:27
中杯o3成OpenAI“性价比之王”?ARC-AGI测试结果出炉:得分翻倍、成本仅1/20
2025-04-23 11:51:39
774 文章
783146 浏览
24小时热文
更多
-
2026-07-02 20:19:28 -
2026-07-02 20:17:31 -
2026-07-02 19:24:46