综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
Anthropic发布的Claude Sonnet 5上线仅一日便差评刷屏,核心争议在于“性价比全面翻车”。在硬核逻辑测试中,Sonnet 5的极限分数与Qwen、MiniMax等国产模型打平,但测试成本却高达后者的6倍以上。此外,其Max推理模式易陷入“过度思考”,导致Token消耗暴增,高昂账单已迫使Uber、微软等大厂重新评估或停用。同时,过度保守的安全对齐也使其丧失部分实用价值。尽管Sonnet 5在复杂Agent编程场景表现优异,但在日常推理中,开发者更倾向于选择成本极低的国产大模型。大模型赛道已正式从“拼智商”迈入“拼性价比”的时代。
原文链接
加载更多
暂无内容