1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

开源大模型Mistral Large 2强势推出,以123B参数量,仅用三分之一的参数,性能媲美甚至超越了405B参数的Llama 3.1及GPT-4o、Claude 3 Opus等闭源模型。Mistral Large 2在代码和数学推理能力上表现出色,拥有128k的上下文窗口,支持多种自然语言及编程语言。此模型的发布引发了业界广泛关注,尤其是Perplexity CEO Aravind Srinivas指出,开源追赶闭源的趋势明显,未来仅有头部闭源模型具有价值。 Mistral Large 2在性能/成本评价指标上树立了新的前沿,特别是在代码生成、数学推理等方面。模型在多项基准测试中表现出色,与顶级闭源模型竞争,甚至在某些方面超越。其在指令遵循和对齐方面的提升尤为显著,且在生成内容时注重简洁性,避免冗余。此外,Mistral Large 2支持多种自然语言,包括法语、德语等,并在MMLU任务上达到84.0%的准确率。 Mistral Large 2现已在自家平台la Plateforme上提供测试版,支持微调功能,并可在Azure AI Studio、Amazon Bedrock等云服务上访问。模型采用新版许可证,仅限于研究和非商业用途。此次发布标志着开源模型在性能和实用性上取得了重大突破,引发业界对开源与闭源模型未来竞争格局的热议。

原文链接
本文链接:https://kx.umi6.com/article/3955.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
DeepSeek成最快突破3000万日活应用程序:手机终端厂商抢着接入DeepSeek
2025-02-14 08:31:54
DeepSeek超越150万模型:成全球最受欢迎开源大模型
2025-02-24 08:18:12
阶跃星辰与吉利联合开源,多模态实力领跑开源大模型
2025-02-18 10:15:09
Mistral新旗舰决战Llama 3.1,最强开源Large 2 123B,扛鼎多语言编程全能王
2024-07-25 20:58:58
Meta发布LLAMA 3.1 405B开源人工智能模型
2024-07-23 23:52:08
最强模型Llama 3.1 405B正式发布
2024-07-24 22:12:32
Qwen3小升级即SOTA,开源大模型王座快变中国内部赛了
2025-07-22 13:34:56
新浪微博发布其首个开源大模型 VibeThinker-1.5B,小模型挑战巨量参数对手
2025-11-13 21:19:44
千问3.5霸榜全球开源大模型前四,10分钟通过中级程序员5小时编程
2026-02-26 17:16:50
中兴努比亚启动接入百度文心 4.5 系列开源大模型:提供更具情感化的对话体验,准确快速的文本处理
2025-07-10 10:14:17
阿里研究院:DeepSeek是对开源大模型价值的强有力支持
2025-03-10 18:56:59
中国,正在批量制造AI印钞机
2025-04-16 16:07:51
踢馆Llama 3.1,“欧洲OpenAI”发布开源新模型Large 2 | 最前线
2024-07-26 17:55:25
24小时热文
更多
扫一扫体验小程序