1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

《科创板日报》10日讯,小红书开源首个大模型dots.llm1,该模型为1420亿参数的混合专家模型(MoE),在推理时仅激活140亿参数,从而在保证高性能的同时显著降低训练和推理成本。值得注意的是,dots.llm1在预训练阶段采用11.2万亿非合成数据,这使其在中英文、数学及对齐任务上的表现接近阿里Qwen3-32b。

原文链接
本文链接:https://kx.umi6.com/article/19964.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
刚刚,马斯克开源Grok 2.5:中国公司才是xAI最大对手
2025-08-24 10:10:55
关于 AI Infra 的一切
2025-08-11 19:08:22
阿里云通义千问开源 Qwen3-VL-30B-A3B 模型:智能体任务等领域媲美 GPT-5-Mini
2025-10-04 14:01:20
大模型“记性差一点”反而更聪明!金鱼损失随机剔除token,让AI不再死记硬背
2025-09-03 17:49:26
港股AGI第一股“云知声”首战告捷:大模型贡献1亿收入,单客价直线提升116.2%,AI保险业务暴涨1386.8%
2025-08-29 20:43:34
GPT-5能让普通人变成博士,但魔法依旧没有
2025-08-08 12:10:14
通义万相全新动作生成模型开源
2025-09-19 15:17:03
DeepSeek新大招曝光:下一步智能体
2025-09-05 10:15:28
DeepSeek V3.2、GLM4.6等大模型即将发布
2025-09-29 17:14:30
蚂蚁发布并开源万亿参数思考模型Ring-1T
2025-10-14 17:25:02
腾讯混元3D-Omni、混元3D-Part发布并开源
2025-09-26 18:33:53
两部门:到2027年推动五个以上专业大模型在电网、发电、煤炭、油气等行业深度应用
2025-09-08 10:56:26
真正的AI竞争力,藏在大模型“后训练”这一步
2025-10-13 16:59:55
24小时热文
更多
扫一扫体验小程序