开源大模型杀疯了！Mistral新模型三分之一参数卷爆Llama 3.1，“新趋势已显而易见”

2024-07-25 13:34:08

发布在

快讯

阅读：1000

开源大模型Mistral Large 2强势推出，以123B参数量，仅用三分之一的参数，性能媲美甚至超越了405B参数的Llama 3.1及GPT-4o、Claude 3 Opus等闭源模型。Mistral Large 2在代码和数学推理能力上表现出色，拥有128k的上下文窗口，支持多种自然语言及编程语言。此模型的发布引发了业界广泛关注，尤其是Perplexity CEO Aravind Srinivas指出，开源追赶闭源的趋势明显，未来仅有头部闭源模型具有价值。 Mistral Large 2在性能/成本评价指标上树立了新的前沿，特别是在代码生成、数学推理等方面。模型在多项基准测试中表现出色，与顶级闭源模型竞争，甚至在某些方面超越。其在指令遵循和对齐方面的提升尤为显著，且在生成内容时注重简洁性，避免冗余。此外，Mistral Large 2支持多种自然语言，包括法语、德语等，并在MMLU任务上达到84.0%的准确率。 Mistral Large 2现已在自家平台la Plateforme上提供测试版，支持微调功能，并可在Azure AI Studio、Amazon Bedrock等云服务上访问。模型采用新版许可证，仅限于研究和非商业用途。此次发布标志着开源模型在性能和实用性上取得了重大突破，引发业界对开源与闭源模型未来竞争格局的热议。

原文链接

本文链接：https://kx.umi6.com/article/3955.html

转载请注明文章出处

LLAMA 3.1 405B