1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

9月22日,Meta发布MobileLLM-R1系列小语言模型,参数量分别为1.4亿、3.6亿和9.5亿,专为移动设备等轻量级平台设计。该模型经过监督式微调(SFT),聚焦数学、编程(如Python、C++)及科学问题,预训练数据仅约2TB高质量token,总数据量不到5TB。在多项基准测试中,其性能超越使用36TB数据训练的Qwen 3-0.6B。例如,在MATH测试中,MobileLLM-R1 950M准确率是Olmo 1.24B的5倍,编程任务表现同样优异。模型已开源,采用Apache 2.0协议,可通过vLLM推理引擎运行,并在Hugging Face平台发布。

原文链接
本文链接:https://kx.umi6.com/article/25657.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Meta 开源 MobileLLM-R1 系列小语言 AI 模型:参数量不到 10 亿、专攻数学编程科学问题
2025-09-22 21:03:24
宇树 G1 人形机器人遭“围殴”,摔倒后能快速起身
2025-09-22 19:01:08
马斯克 xAI 最具性价比 AI 模型 Grok 4 Fast 登场:Grok 4 级性能,价格降低 98%
2025-09-20 12:27:10
瑞德智能:正积极布局AI健康管理及能源管理领域研发工作
2025-09-20 11:27:53
腾讯智能体开源大动作!关键技术都拿出来了,开发平台还全面升级
2025-09-22 12:58:11
“O链”牵动果链 千亿龙头T字板 AI硬件带来新机遇?
2025-09-22 11:57:33
首创双NPU架构一鸣惊人,联发科天玑9500重磅加码主动式AI体验
2025-09-22 20:01:48
OpenAI首批智能硬件传出新消息
2025-09-20 09:24:50
三年登顶全球估值第一,这家机器人公司凭什么?
2025-09-21 22:49:22
安徽发布首批2025年度人工智能场景创新项目榜单
2025-09-20 21:34:54
OpenAI走向“算力帝国”
2025-09-22 18:02:48
“一页纸”吃透人形机器人产业链
2025-09-22 07:52:53
Data+AI驱动技术服务升级,腾讯云智能顾问和腾讯云可观测发布全新AI能力,助力客户高效用云
2025-09-22 12:59:21
24小时热文
更多
扫一扫体验小程序