开源模型 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

HuggingChat Omni 集成式 AI 平台发布，可针对用户指令从百款开源模型库中挑选最适合回答

10月18日，Hugging Face发布集成式AI平台HuggingChat Omni，可从超100个开源模型中自动选择最适合用户指令的模型，涵盖GPT-OSS、Qwen、Deepseek等知名产品。平台基于Katanemo的Arch-Router-1.5B构建，能根据语义智能调用不同主题和操作类型模型，匹配效率优于业界竞品且完全开源。Hugging Face联合创始人Clément Delangue表示，这是“仅仅是个开始”，目前平台已收录200万个开源模型，覆盖文本、图像、音频等多个领域，未来将进一步完善功能与体验。

原文链接

DreamCoder

10-18 10:30:57

HuggingChat Omni

开源模型

智能匹配

分享至

打开微信扫一扫

内容投诉

生成图片

华为盘古 Ultra-MoE-718B-V1.1 正式开源并开放下载，模型权重与技术细节全面公开

10月16日，华为宣布盘古Ultra-MoE-718B-V1.1大模型正式开源，模型权重与技术细节全面公开，可在GitCode平台下载。该模型基于昇腾NPU训练，总参数规模达718B，激活参数量为39B，融合“快思考”与“慢思考”能力，支持多轮工具调用和模式切换。相比V1.0版本，V1.1在幻觉控制、工具调用及综合性能上显著提升，幻觉率从10.11%降至3.85%，并新增Int8量化版本，显存占用减少一半，吞吐提升20%。此前，该模型在SuperCLUE榜单中位列开源模型第三，尤其在数学推理、代码生成等领域表现优异。硬件需Atlas 800T A2（≥32卡）支持。官方地址已公布。

原文链接

量子思考者

10-16 17:57:55

华为盘古

开源模型

混合专家

分享至

打开微信扫一扫

内容投诉

生成图片

开源 AI 模型 TOP5，被中国厂商包圆

2025年10月，中国开源AI模型在全球榜单中占据前五，阿里Qwen系列和DeepSeek表现尤为突出，引发热议。LMArena数据显示，国产模型如智谱GLM-4.6、DeepSeek-v3.2紧跟顶级闭源模型GPT-5等，在文本、前端开发、视觉领域均有亮眼成绩。腾讯Hunyuan-vision-1.5计划开源，视频模型Wan-v2.2表现最佳。HuggingFace趋势榜显示，蚂蚁Ling-1T和智谱GLM-4.6备受关注，DeepSeek-R1下载量领先。网友认为中国正引领开源创新潮流，或重塑全球格局。同时，Meta的Llama 5项目传闻受阻，引发外界对其未来发展的猜测。

原文链接

智能视野

10-15 18:39:57

中国厂商

大模型

开源模型

分享至

打开微信扫一扫

内容投诉

生成图片

开源模型TOP5，被中国厂商包圆了

2025年10月，中国厂商在开源大模型领域占据主导地位，榜单前五名全部由中国模型包揽，包括阿里的Qwen系列和DeepSeek等。这些模型在文本、前端开发、视觉及视频等多个领域表现突出，部分已超越顶级闭源模型如GPT-5和Claude。HuggingFace趋势榜显示，国产模型如GLM-4.6和Ling-1T备受关注，Qwen3更是成为下载量最高的百亿级参数模型之一。这一现象引发热议，网友认为中国力量正重新定义全球创新格局。同时，Meta的Llama系列因Llama 4翻车事件备受质疑，尽管有传闻称Llama 5或将无果而终，但具体进展仍待观察。

原文链接

AI奇点纪元

10-15 17:36:49

中国厂商

大模型

开源模型

分享至

打开微信扫一扫

内容投诉

生成图片

美国“SPAC之王”查马斯：公司已转用Kimi K2

10月11日，美国“SPAC之王”查马斯宣布，其公司已将大量工作需求转移至中国开发的Kimi K2模型。他指出，K2不仅性能卓越，且成本远低于OpenAI和Anthropic等美国公司的产品。查马斯认为，由中国引领的开源模型正在挑战美国闭源模型的市场主导地位，这一转变或将对全球人工智能领域产生深远影响。（财联社、36氪）

原文链接

像素宇宙

10-11 19:32:28

Kimi K2

SPAC之王

开源模型

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek等开源模型，更“浪费”token吗？

标题：开源模型真的更“浪费”token吗？正文：近期研究发现，像DeepSeek-R1等开源模型在回答问题时往往显得不够“节制”，尤其是在简单问题上，容易陷入过于复杂的思考。这种冗长的推理过程可能导致其单位token成本优势被抵消。 NousResearch团队的研究试图解答一个关键问题...

原文链接

AI幻想空间站

10-11 10:17:13

DeepSeek

Token消耗

开源模型

分享至

打开微信扫一扫

内容投诉

生成图片

蚂蚁集团发布万亿参数旗舰模型 Ling-1T 并开源，多项指标位居开源模型榜首

10月9日，蚂蚁集团发布万亿参数通用语言模型Ling-1T，并开源。作为蚂蚁百灵大模型Ling 2.0系列的旗舰产品，Ling-1T在多项复杂推理基准测试中表现卓越，尤其在代码生成、逻辑推理和竞赛数学等领域领先开源模型。例如，在AIME 25数学竞赛中，其准确率达70.42%，优于Gemini-2.5-Pro。模型基于20T+高质量语料预训练，支持128K上下文窗口，通过演进式思维链提升推理能力。此外，Ling-1T展现跨领域泛化能力，如工具调用任务中达70%准确率。团队指出其局限性包括高推理成本、智能体能力需强化及指令遵循问题，并计划优化架构与对齐技术。开源地址已公布，供全球开发者体验与使用。

原文链接

神经网络领航员

10-11 09:36:05

Ling-1T

开源模型

蚂蚁集团

分享至

打开微信扫一扫

内容投诉

生成图片

AI生图新的王者诞生了！腾讯混元图像3.0登顶榜一

10月5日，腾讯混元图像3.0在AI文生图权威榜单LMArena登顶第一，击败Nano、Banana等强劲对手，成为全球效果最佳的开源生图模型。其凭借三大优势脱颖而出：一是具备推理能力，将逻辑融入画面；二是精准渲染中英文长文本，细节表现优异；三是拥有高审美水平，生成图像真实且符合用户需求。此前，9月初发布的混元图像2.1已是最佳开源模型。目前，腾讯混元已构建起覆盖语言、图像、视频、3D等多模态开源矩阵，社区衍生模型超3000个，其中3D系列下载量超260万，曾获全球3D生成榜单第一。未来还将推出图生图、图像编辑等功能版本。

原文链接

智能维度跳跃

10-05 17:24:12

AI文生图

开源模型

腾讯混元图像3.0

分享至

打开微信扫一扫

内容投诉

生成图片

可能是目前效果最好的开源生图模型，混元生图3.0来了

2025年9月30日，腾讯混元发布并开源了最新生图模型——混元图像3.0（HunyuanImage 3.0）。该模型参数规模达80B，是目前参数量最大的开源生图模型，融合理解与生成能力，效果媲美业界头部闭源模型。HunyuanImage 3.0支持多分辨率图像生成，具备强大的指令遵从、世界知识推理和文字渲染能力，可生成解方程步骤图、算法流程图等复杂内容，并提供极致美学风格。技术上基于Hunyuan-A13B架构，采用原生多模态设计和广义因果注意力机制，显著提升语义对齐与细节控制能力。模型训练历经四阶段预训练及多阶段后训练打磨，数据筛选严格且多样化。测评显示，其在机器指标和人工评测中均优于多个领先模型。项目已完全开源，代码与权重同步释出。

原文链接