
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
近日,中国开源AI模型DeepSeek低调发布R1(0528)更新,将幻觉率降低45%-50%,性能逼近OpenAI o3及Google Gemini 2.5 Pro。海外开发者和研究者通过基准测试发现,R1在数学、编程及推理能力上表现突出,尤其在复杂代码生成和角色扮演中表现优异。DeepSeek官方称其多项评测成绩领先国内模型,接近国际顶尖水平。尽管有用户指出上下文窗口长度限制等问题,但R1凭借低成本和开放权重受到广泛好评。此次更新引发Reddit和X等社交平台热议,有人称其为“开源的巨大胜利”。此外,有分析机构指出,R1的智能指数已超越多家国际巨头模型。DeepSeek的持续迭代正对传统AI巨头形成压力,其免费开源模式被视作推动行业变革的关键力量。
原文链接
Llama 4在大模型竞技场排名大跌,从第2名降至第32名,引发社区信任危机。此前,Meta被指在竞技场作弊,重新推出的非特供版模型表现不佳。
修正后的Llama 4为HuggingFace开源版同款,名为Llama-4-Maverick-17B-128E-Instruct,具有17B激活参数和12...
原文链接
加载更多

暂无内容