开源大模型 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

千问3.5霸榜全球开源大模型前四，10分钟通过中级程序员5小时编程

2月26日，阿里千问3.5系列模型在Hugging Face开源大模型榜单中包揽前四，性能刷新中等尺寸模型新高，部分模型可部署于消费级显卡。全球前十开源模型均来自中国或其衍生模型，基于千问的3款衍生模型也入选前十。开发者测评显示，Qwen3.5-35B-A3B仅用10分钟即可完成中级程序员需5小时的编程测试，并在上下文引用等关键能力上表现惊艳。目前，千问已开源400多款模型，累计下载量超10亿，衍生模型超20万，成为全球第一开源大模型。来源：阿里云。

原文链接

智能涌动

02-26 17:16:50

中级程序员

千问3.5

开源大模型

分享至

打开微信扫一扫

内容投诉

生成图片

千问系列模型下载量突破10亿次

财联社1月21日电，阿里千问系列模型在Hugging Face开源社区取得新突破：衍生模型数超20万个，成为全球首个达成此目标的开源大模型；同时，千问系列模型下载量突破10亿次，日均下载达110万次，超越美国Llama，稳居全球第一。这一成绩彰显中国AI技术的国际领先地位，展现强大的开源影响力。

原文链接

AGI探路者

01-21 12:07:14

下载量

千问系列模型

开源大模型

分享至

打开微信扫一扫

内容投诉

生成图片

陈天桥代季峰打响2026大模型第一枪：30B参数跑出1T性能

2026年1月，陈天桥与代季峰携手发布开源大模型MiroThinker 1.5，参数仅30B却跑出媲美1T性能，成为智能体模型领域新标杆。在多项基准测试中，其表现超越GPT-5-High、Gemini-3-Pro等顶尖模型，尤其BrowseComp测试刷新全球纪录。相比Kimi-K2-Thinkin...

原文链接

数据炼金师

01-06 15:08:39

MiroThinker 1.5

开源大模型

陈天桥

分享至

打开微信扫一扫

内容投诉

生成图片

AI大佬锐评开源大模型：DS/Qwen/Kimi并列第一硅谷巨头拉完了

12月15日，AI技术领域权威人士Nathan Lambert与Florian Brand博士联合发布2025年开源AI大模型榜单。该榜单评估了35家机构的开源模型，基于影响力和代表性进行排名。结果显示，中国企业在开源AI领域占据主导地位，DeepSeek、Qwen及Kimi三大模型并列第一档“先锋”级别，成为行业焦点。Qwen系列衍生出数百个模型，覆盖多领域；DeepSeek年初推出的DS R1曾震撼业界，性能超越多个顶级闭源模型；Kimi则发布了首个万亿参数开源模型。第二档包括智谱和MiniMax，同样来自中国。相比之下，美国开源模型表现疲软，最佳仅位列第三档，OpenAI开源模型仅居第四档。而去年表现出色的Meta跌至末档，Llama3失去竞争力，其高额投入未见显著成果。

原文链接

数据炼金师

12-15 22:03:31

AI技术

中美对比

开源大模型

分享至

打开微信扫一扫

内容投诉

生成图片

新浪微博发布其首个开源大模型 VibeThinker-1.5B，小模型挑战巨量参数对手

新浪微博于11月13日发布其首个开源大模型VibeThinker-1.5B，参数量仅15亿，却通过创新的“频谱到信号原理”（SSP）训练方法，在多个高难度测试集中表现优异。该模型在数学和编程算法测试中超越参数量远超自身的巨量模型，如DeepSeek-R1-0120（6710亿参数），并接近4560亿参数的MiniMax-M1。其训练成本不足8000美元，远低于行业水平，降低了几十倍。VibeThinker-1.5B的开源旨在为资源有限的企业与高校提供高性价比研发路径，推动技术普惠。项目已上线GitHub、HuggingFace等平台。

原文链接

DreamCoder

11-13 21:19:44

VibeThinker-1.5B

开源大模型

新浪微博

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI重返开源大模型赛道，谈一谈我关注的一些要点

2025年8月5日，OpenAI发布两款开源大模型GPT-OSS 120B和GPT-OSS-20B，可在Hugging Face平台下载并用于商业应用。这是自2019年11月以来OpenAI首次开源大模型，标志着其重返开源赛道。开源大模型允许本地部署，提升数据安全性与定制化能力，尤其吸引对数据隐私敏感的行业客户。尽管开源版本性能接近GPT-4o3，但训练数据截至2024年6月，技术领先优势有限。OpenAI此举或因市场竞争压力，意在争夺对闭源模型持保留态度的企业与政府客户。目前，全球主流大模型开发商中仅剩Anthropic和字节跳动未发布开源版本。

原文链接

智能视野

08-06 15:38:28

gpt-oss

OpenAI

开源大模型

分享至

打开微信扫一扫

内容投诉

生成图片

Qwen3小升级即SOTA，开源大模型王座快变中国内部赛了

2025年7月，Qwen3迎来重要升级，参数量235B但性能超越Kimi K2（1T规模）。新版本增强对256K长上下文的理解能力，改进逻辑推理、多语言支持及文本生成质量，并在基准测试中表现优异。Qwen官方宣布放弃混合思维模式，分别训练Instruct和Thinking模型，当前发布版本仅支持非思考模式。网页版已上线，通义APP尚未更新。此次更新引发热议，被赞为中等规模模型中的领先者。与此同时，开源大模型竞争愈发激烈，NVIDIA近期发布的OpenReasoning-Nemotron实际基于Qwen-2.5微调。随着Llama转向闭源，开源领域正进入‘中国时间’，王座争夺战愈演愈烈。

原文链接

元界筑梦师

07-22 13:34:56

Qwen3

中国时间

开源大模型

分享至

打开微信扫一扫

内容投诉

生成图片

K2开源大模型，会是Kimi的DeepSeek时刻吗？

2025年7月，MoonShot发布开源大模型K2，参数规模达万亿级别（1T），成为当前开源模型中最大。K2在多项基准测试中表现优异，性价比高，支持上下文长度达128K，迅速登上HuggingFace热度榜首，并获硅谷开发者青睐。相比DeepSeek的R1和Meta的Llama4，K2以更低训练成本和技术优势引发关注，其架构优化及自研技术（如MuonClip优化器和QK-Clip）进一步提升效率。与此同时，MoonShot与MiniMax等中国AI企业正主导全球开源模型创新趋势，展现底层研发能力。K2的多智能体协作能力或成商业市场关键，MoonShot未来可能迈向上市。

原文链接

Nebula

07-14 11:19:10

DeepSeek

K2开源大模型

MoonShot

分享至

打开微信扫一扫

内容投诉

生成图片

中兴努比亚启动接入百度文心 4.5 系列开源大模型：提供更具情感化的对话体验，准确快速的文本处理

7月10日，中兴努比亚宣布接入百度文心4.5系列开源大模型，基于“AI Together”理念优化多专家模型架构，提供情感化对话和高效文本处理能力。百度于6月30日开源文心4.5系列，包括47B、3B参数的混合专家模型及0.3B参数的稠密型模型，并开放预训练权重与推理代码。该系列模型已可在飞桨星河社区、HuggingFace等平台下载部署，同时支持百度智能云千帆平台API服务。文心4.5模型最早于今年3月发布，此次合作将进一步推动AI技术应用与普及。

原文链接

灵感Phoenix

07-10 10:14:17

中兴努比亚

开源大模型

百度文心4.5

分享至

打开微信扫一扫

内容投诉

生成图片

印度开源大模型上线两天仅300余次下载

据《科创板日报》27日消息，印度公司Sarvam AI日前发布的主权基础大模型Sarvam-M上线仅两天下载量仅为334次，目前总下载量为718次，引发业内关注。Sarvam-M基于Mistral Small构建，参数规模达240亿且权重开放，旨在打造混合语言模型。然而，其低迷的下载数据受到质疑，风投公司Menlo Ventures投资人Deedy Das批评称这一成绩‘令人尴尬’，认为其缺乏实际受众。作为印度‘IndiaAI Mission’项目的一部分，Sarvam AI肩负构建国家主权大模型的重要任务，但当前表现或对其目标造成一定影响。

原文链接