开源大模型Mistral Large 2强势推出,以123B参数量,仅用三分之一的参数,性能媲美甚至超越了405B参数的Llama 3.1及GPT-4o、Claude 3 Opus等闭源模型。Mistral Large 2在代码和数学推理能力上表现出色,拥有128k的上下文窗口,支持多种自然语言及编程语言。此模型的发布引发了业界广泛关注,尤其是Perplexity CEO Aravind Srinivas指出,开源追赶闭源的趋势明显,未来仅有头部闭源模型具有价值。 Mistral Large 2在性能/成本评价指标上树立了新的前沿,特别是在代码生成、数学推理等方面。模型在多项基准测试中表现出色,与顶级闭源模型竞争,甚至在某些方面超越。其在指令遵循和对齐方面的提升尤为显著,且在生成内容时注重简洁性,避免冗余。此外,Mistral Large 2支持多种自然语言,包括法语、德语等,并在MMLU任务上达到84.0%的准确率。 Mistral Large 2现已在自家平台la Plateforme上提供测试版,支持微调功能,并可在Azure AI Studio、Amazon Bedrock等云服务上访问。模型采用新版许可证,仅限于研究和非商业用途。此次发布标志着开源模型在性能和实用性上取得了重大突破,引发业界对开源与闭源模型未来竞争格局的热议。
原文链接
本文链接:https://kx.umi6.com/article/3955.html
转载请注明文章出处
相关推荐
.png)
换一换
DeepSeek成最快突破3000万日活应用程序:手机终端厂商抢着接入DeepSeek
2025-02-14 08:31:54
OpenAI反对美国SB-1047法案,会杀死开源大模型!
2024-08-23 12:53:38
DeepSeek超越150万模型:成全球最受欢迎开源大模型
2025-02-24 08:18:12
Mistral:Large 2 模型训练碳排放当量 20 万吨,一次推理响应要 45ml 水
2025-08-05 11:13:01
大模型全开源了,那到底咋挣钱啊?
2025-03-18 08:22:55
Mistral AI新旗舰模型挑战Llama 3.1,1230亿参数性能直逼GPT-4o
2024-07-26 08:31:12
权威榜单发布,全球开源大模型前十均为阿里通义千问衍生模型
2025-02-10 16:10:32
踢馆Llama 3.1,“欧洲OpenAI”发布开源新模型Large 2 | 最前线
2024-07-26 17:55:25
印度开源大模型上线两天仅300余次下载
2025-05-27 17:22:55
大模型行业,根本没有什么“真”开源?
2024-08-01 11:04:31
阶跃星辰与吉利联合开源,多模态实力领跑开源大模型
2025-02-18 10:15:09
Qwen3小升级即SOTA,开源大模型王座快变中国内部赛了
2025-07-22 13:34:56
大模型格局变天:Llama3.1 诞生
2024-07-24 14:58:47
543 文章
264828 浏览
24小时热文
更多

-
2025-10-23 21:15:29
-
2025-10-23 20:16:19
-
2025-10-23 20:15:12