Mistral AI于1月31日发布了Mistral-Small-24B-Instruct-2501模型,简称Small 3,拥有240亿参数。该模型具备先进推理能力、多语言支持及便捷应用集成,对标Meta的Llama 3.3 70B和阿里巴巴的Qwen 32B,据称在相同硬件上性能超三倍。Small 3针对本地部署优化,能在RTX 4090 GPU或配备32GB RAM的笔记本上流畅运行,支持JSON格式输出和函数调用,适合对话和特定任务。在HumanEval上达到84.8%准确率,在MMLU基准测试中超过81%。该模型已基于Apache 2.0许可证开源,适用于对话式AI、低延迟自动化、特定领域专业知识及本地推理。
原文链接
本文链接:https://kx.umi6.com/article/12442.html
转载请注明文章出处
相关推荐
换一换
豆包1.5 Pro重磅更新!7倍MoE性能杠杆,“不使用任何其他模型数据”
2025-01-22 23:05:37
广东:支持基于开源鸿蒙的机器人等多领域操作系统生态发展
2026-04-22 17:30:14
CPU“严重供不应求” 供应链称国际大厂酝酿Q3再涨价
2026-04-23 16:19:37
别高估英伟达 别低估DeepSeek
2026-04-24 17:24:15
联通在线申请注册呦爱机器人商标
2026-04-24 13:14:01
横店影视:将向“以IP为核心的全链路运营模式”转型升级
2026-04-23 15:14:07
赛力斯申请注册天行平台商标
2026-04-23 14:10:41
成都出台人工智能产业人才九条 最高给予10亿元综合支持
2026-04-23 20:29:56
腾讯云TokenHub上架DeepSeek-V4
2026-04-24 16:22:09
国家知识产权局:将积极完善新兴领域知识产权保护制度
2026-04-23 17:20:53
特斯拉CFO:今年将豪掷250亿美元 押注AI与机器人
2026-04-23 11:04:57
腾讯与阿里巴巴洽谈投资DeepSeek 估值超过200亿美元
2026-04-22 19:27:03
荣耀WIN游戏本等多款新品正式发布,荣耀PC家族全面爆发
2026-04-24 17:20:32
682 文章
525373 浏览
24小时热文
更多
-
2026-04-24 18:31:29 -
2026-04-24 18:30:24 -
2026-04-24 18:29:17