开源大模型Mistral Large 2强势推出,以123B参数量,仅用三分之一的参数,性能媲美甚至超越了405B参数的Llama 3.1及GPT-4o、Claude 3 Opus等闭源模型。Mistral Large 2在代码和数学推理能力上表现出色,拥有128k的上下文窗口,支持多种自然语言及编程语言。此模型的发布引发了业界广泛关注,尤其是Perplexity CEO Aravind Srinivas指出,开源追赶闭源的趋势明显,未来仅有头部闭源模型具有价值。 Mistral Large 2在性能/成本评价指标上树立了新的前沿,特别是在代码生成、数学推理等方面。模型在多项基准测试中表现出色,与顶级闭源模型竞争,甚至在某些方面超越。其在指令遵循和对齐方面的提升尤为显著,且在生成内容时注重简洁性,避免冗余。此外,Mistral Large 2支持多种自然语言,包括法语、德语等,并在MMLU任务上达到84.0%的准确率。 Mistral Large 2现已在自家平台la Plateforme上提供测试版,支持微调功能,并可在Azure AI Studio、Amazon Bedrock等云服务上访问。模型采用新版许可证,仅限于研究和非商业用途。此次发布标志着开源模型在性能和实用性上取得了重大突破,引发业界对开源与闭源模型未来竞争格局的热议。
原文链接
本文链接:https://kx.umi6.com/article/3955.html
转载请注明文章出处
相关推荐
.png)
换一换
最强模型Llama 3.1 405B正式发布
2024-07-24 22:12:32
阿里研究院:DeepSeek是对开源大模型价值的强有力支持
2025-03-10 18:56:59
开源大模型新王干翻GPT-4o,新技术可纠正自己幻觉,数学99.2分刷爆测试集
2024-09-06 16:06:38
442 文章
64713 浏览
24小时热文
更多

-
2025-07-19 15:54:36
-
2025-07-19 15:54:26
-
2025-07-19 14:57:21