1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
DeepSeek 丢了开源第一王座,但继任者“Kimi K2”依然来自中国
2025年7月18日,中国开源模型Kimi K2超越DeepSeek,登上全球开源模型排名第一,并在总榜中位列第五,紧追Grok 4等顶尖闭源模型。Kimi K2在多项能力上表现出色,如连续多轮对话、编程能力和复杂提示词应对均位居前列。其在开源社区反响热烈,GitHub标星达5.6K,Hugging Face下载量近10万。尽管Kimi K2基于DeepSeek V3架构,但通过参数优化实现性能提升,被评价为“精打细算”的改进。随着开源模型崛起,‘开源=性能弱’的刻板印象正被打破,行业专家普遍看好开源未来。值得一提的是,全球总榜TOP 10中唯二开源模型均来自中国。
幻彩逻辑RainbowLogic
07-18 18:42:56
DeepSeek V3
Kimi K2
开源模型
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek终于丢了开源第一王座,但继任者依然来自中国
2025年7月,Kimi K2超越DeepSeek成为全球开源模型排名第一,总榜第五,紧追Grok 4等顶尖闭源模型。其在连续对话、编程能力等多项指标上表现优异,甚至与闭源模型抗衡。这是继DeepSeek后,再次由中国团队开发的模型登顶开源榜首。Kimi K2发布一周内,GitHub获5.6K星标,Hugging Face下载量近10万,引发广泛关注。尽管采用DeepSeek V3架构,但通过参数优化实现性能提升,被评价为‘大胆’且高效的选择。行业专家认为,开源模型正迅速崛起,逐渐打破‘开源=性能弱’的刻板印象,未来或将在AI发展中扮演关键角色。
新智燎原
07-18 17:42:26
DeepSeek V3
Kimi K2
开源模型
分享至
打开微信扫一扫
内容投诉
生成图片
OpenAI再次推迟发布开源模型
7月14日,OpenAI CEO Sam Altman宣布,原定于下周发布的开源模型将无限期推迟,以进行额外安全测试和高风险场景评估。这是该模型自今年夏季以来第三次延期发布。Altman强调,模型一旦发布便不可撤回,公司需确保其在安全性和能力上达到高标准。OpenAI研究副总裁Aidan Clark表示,尽管团队对模型性能满意,但开源标准更高,仍需时间完善细节。此次调整反映了OpenAI对模型开源的谨慎态度及对技术安全性的高度重视。
E-Poet
07-14 08:16:03
OpenAI
安全测试
开源模型
分享至
打开微信扫一扫
内容投诉
生成图片
杨植麟被梁文锋叫醒了!Kimi新模型发布即开源,1T参数全线SOTA
2025年7月12日,Kimi发布全新基础大模型Kimi K2,采用MoE架构,总参数1T,激活参数32B,支持128K上下文。新模型在代码、Agent任务和数学推理等领域表现卓越,创造多项开源SOTA成绩,并同步上线Web端、App及API服务。此次发布即开源,提供两个版本:Kimi-K2-Base与Kimi-K2-Instruct,遵循修改版MIT协议。这是自DeepSeek R1冲击172天后,Kimi的明确回应,表明其坚持自研大模型的决心。Kimi CEO杨植麟以实际行动证明技术领先性,重新回归竞逐AGI初心。
AGI探路者
07-12 13:50:53
Kimi K2
SOTA
开源模型
分享至
打开微信扫一扫
内容投诉
生成图片
最强3B「小钢炮」,代码数据全公开!推理随意开关,128k超长上下文
2025年7月11日,Hugging Face发布新一代最强30亿参数小模型SmolLM3,支持128k超长上下文、双推理模式(think/no_think)及多语言处理。该模型性能超越Llama3.2-3B和Qwen2.5-3B,逼近40亿参数模型,并完全开源训练、对齐、架构与数据。团队通过优化架构(如GQA机制、NoPE编码)及三阶段训练策略提升模型能力,尤其在数学、编程和长文本任务中表现优异。此外,SmolLM3引入双模式指令模型构建方案,平衡推理与非推理性能,支持工具调用与灵活场景适配。研究者可通过transformers库轻松部署,模型已在Hugging Face平台开放下载。
超频思维站
07-11 11:34:58
SmolLM3
开源模型
长上下文
分享至
打开微信扫一扫
内容投诉
生成图片
闭源主力选手拥抱开源?OpenAI 被曝最快下周推开源 AI 模型,o3 mini 级推理能力
7月10日,据The Verge报道,OpenAI计划最快下周推出开源AI模型,类似于o3 mini,具备最新模型的推理能力。这是自2019年GPT-2发布以来,OpenAI首次开源语言模型,可能加剧其与微软之间的分歧。此前,OpenAI主要闭源,仅公开过Whisper系列模型权重。目前,OpenAI已邀请开发者和研究人员测试该模型,并征求社区反馈。值得注意的是,微软作为OpenAI独家云服务提供商,享有大部分模型访问权,而开源将使竞争对手也能托管该模型,可能影响双方合作。
AI创想团
07-10 11:22:08
OpenAI
开源模型
微软
分享至
打开微信扫一扫
内容投诉
生成图片
昆仑万维发布并开源 Skywork-R1V 3.0,多模态推理能力逼近人类专家水平
7月9日,昆仑万维发布并开源Skywork-R1V 3.0,其多模态推理能力逼近人类专家水平。新版本通过强化学习策略显著提升跨模态推理能力,在复杂逻辑建模和跨学科泛化上表现优异。模型基于InternVL-38B蒸馏数据训练,仅用约1.2万条监督微调样本和1.3万条强化学习样本,实现高效训练。在权威评测中,Skywork-R1V 3.0取得多项领先成绩:MMMU评测达76.0分,超越Claude-3.7-Sonnet和GPT-4.5;EMMA-Mini(CoT)评分40.3分,居开源模型首位;数学、物理、逻辑等领域均表现出色,部分指标超闭源模型。目前,模型已开放下载,涵盖HuggingFace、GitHub等平台。
神经网络领航员
07-09 11:04:18
Skywork-R1V 3.0
多模态推理
开源模型
分享至
打开微信扫一扫
内容投诉
生成图片
刷新复杂Agent推理记录!阿里通义开源网络智能体超越DeepSeek R1,Grok-3
标题:阿里通义开源智能体WebSailor刷新复杂推理记录 在互联网信息检索任务中,即使是强大的语言模型(LLM),面对高度模糊和复杂的问题时,往往难以找到答案。例如,“这首与南美某首都相关的乐曲,其歌词作者曾获当地荣誉,旋律创作者就读于哥伦比亚的艺术学院,这首乐曲叫什么?”这类问题需要抽丝剥茧...
AI创意引擎
07-07 17:32:00
BrowseComp
WebSailor
开源模型
分享至
打开微信扫一扫
内容投诉
生成图片
B站开源动漫视频生成模型 AniSora V3 版,速度更快、质量更高
正文:7月2日,B站团队开源动漫视频生成模型AniSora更新至V3预览版。新版在生成质量、动作流畅度和风格多样性上显著优化,支持多种动漫风格视频生成,包括番剧、国创动画、VTuber内容等。核心升级包括时空掩码模块优化、数据集扩展、硬件加速及多任务学习,推理速度提升20%,生成4秒高清视频仅需2-3分钟。V3引入首个针对动漫视频的RLHF框架,角色一致性和动作流畅度达业界顶尖水平。相比V2,伪影问题减少15%,生成时间缩短至平均2.5分钟。AniSora V3专注于2D/2.5D动漫风格,覆盖90%动漫视频应用场景,已吸引社区开发者开发定制化插件。
新智燎原
07-07 08:25:15
AniSora V3
动漫视频生成
开源模型
分享至
打开微信扫一扫
内容投诉
生成图片
业界首个:腾讯混元-A13B 模型发布并开源,极端条件 1 张中低端 GPU 卡即可部署
2023年6月27日,腾讯混元大模型家族发布新成员——混元-A13B模型并开源。该模型是业界首个13B级别的MoE混合推理开源模型,总参数达800亿,激活参数130亿,可在极端条件下仅用1张中低端GPU卡部署。模型通过MoE架构提升推理效率与计算性能,支持快慢两种思考模式,适用于不同任务需求。同时,腾讯开源了两个新数据集ArtifactsBench和C3-Bench,用于代码评估和Agent场景测试。在数学、科学和逻辑推理任务中表现优异,已在GitHub和腾讯云上线。
AI思维矩阵
06-27 17:10:33
MoE架构
开源模型
腾讯混元-A13B
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序