1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年7月11日,Hugging Face发布新一代最强30亿参数小模型SmolLM3,支持128k超长上下文、双推理模式(think/no_think)及多语言处理。该模型性能超越Llama3.2-3B和Qwen2.5-3B,逼近40亿参数模型,并完全开源训练、对齐、架构与数据。团队通过优化架构(如GQA机制、NoPE编码)及三阶段训练策略提升模型能力,尤其在数学、编程和长文本任务中表现优异。此外,SmolLM3引入双模式指令模型构建方案,平衡推理与非推理性能,支持工具调用与灵活场景适配。研究者可通过transformers库轻松部署,模型已在Hugging Face平台开放下载。

原文链接
本文链接:https://kx.umi6.com/article/21574.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
微软将 OpenAI 最小开源模型 gpt-oss-20b 引入 Windows,本地也能跑
2025-08-07 11:47:50
爆火全网FLUX.2重磅上线,开源版Nano Banana来了!
2025-11-26 17:55:27
蚂蚁集团发布万亿参数旗舰模型 Ling-1T 并开源,多项指标位居开源模型榜首
2025-10-11 09:36:05
小米具身大模型 MiMo-Embodied 发布并全面开源,业界首个打通自动驾驶与具身智能
2025-11-21 18:38:45
MiniMax的好日子来了?
2025-06-18 21:51:36
抢跑GPT-5,智谱开源新SOTA模型,一句话搞出能看视频、发弹幕的B站!
2025-07-29 00:21:11
谷歌前 CEO 施密特称中国领先的大模型皆为开源,呼吁中美开展合作
2025-07-26 16:43:43
业界首个:腾讯混元-A13B 模型发布并开源,极端条件 1 张中低端 GPU 卡即可部署
2025-06-27 17:10:33
可能是目前效果最好的开源生图模型,混元生图3.0来了
2025-09-30 21:34:24
李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280
2025-04-08 23:18:28
中国在开源 AI 模型市场首超美国,与 OpenAI 之“封闭”形成鲜明对比
2025-11-26 12:43:57
昆仑万维发布并开源 Skywork-R1V 3.0,多模态推理能力逼近人类专家水平
2025-07-09 11:04:18
深夜突袭,阿里Qwen3登顶全球开源王座!暴击DeepSeek-R1,2小时狂揽17k星
2025-05-05 09:42:37
24小时热文
更多
扫一扫体验小程序