北京时间7月23日晚,Meta宣布发布最新AI大模型Llama 3.1,其中参数规模最大的版本为Llama 3.1-405B,拥有4050亿个参数,标志着开源大模型的“ChatGPT时刻”终于到来。这一模型的推出,意味着开发人员可以自由使用其“蒸馏”输出来训练小众模型,加速专业领域的创新和部署周期。 在短短三个月内,Llama 3.1-405B在多个关键AI基准测试中超越了当前最先进的闭源模型OpenAI GPT-4o,成为开源模型首次击败闭源大模型的里程碑。此外,Llama 3.1-405B的参数量超越了先前的Llama 3-8B和Llama 3-70B,成为Meta迄今为止最大的开源模型之一。Llama 3.1的上下文窗口达到128000个标记,约为一本50页书的长度。 虽然Llama 3.1在某些MMLU和GPQA测试中略逊于GPT-4o,但在IFEval、GSM8K、ARC Challenge和Nexus测试中表现突出。Llama 3.1-405B的开源特性,将有助于促进AI领域的创新,加速模型的开发和应用,同时推动AI伦理和数据隐私的讨论。 Llama 3.1-405B的发布正值AI领域竞争激烈之际,Meta团队表示即将推出的指令调整版本将进一步提升模型性能。此外,Llama 4模型已经在6月开始训练,训练数据来源于社交平台Facebook和Instagram用户的公开帖子。Meta已向数据隐私监管最严格的欧盟地区用户发送超过20亿条通知,并提供选择不将自己的数据用于大模型训练的选项。 此消息对全球AI开发人员和研究者而言,是一个重要且具有里程碑意义的事件,预示着开源AI的发展将更加开放和透明,同时也引发了对数据隐私和伦理问题的深入思考。
原文链接
本文链接:https://kx.umi6.com/article/3978.html
转载请注明文章出处
相关推荐
.png)
换一换
Meta推出世界模型V-JEPA 2 杨立昆参与开发
2025-06-12 14:36:04
根本停不下来,Meta 被曝又从 OpenAI 挖走两名顶级研究人员
2025-07-16 17:09:15
小扎砸14亿从苹果挖走庞若鸣,上交校友成Meta AI梦之队第9位华人
2025-07-10 10:15:30
449 文章
68986 浏览
24小时热文
更多

-
2025-07-19 15:54:36
-
2025-07-19 15:54:26
-
2025-07-19 14:57:21