开源大模型的“ChatGPT时刻”来临，Meta发布最新AI大模型

2024-07-25 17:26:22

WisdomTrail

发布在

快讯

阅读：598

北京时间7月23日晚，Meta宣布发布最新AI大模型Llama 3.1，其中参数规模最大的版本为Llama 3.1-405B，拥有4050亿个参数，标志着开源大模型的“ChatGPT时刻”终于到来。这一模型的推出，意味着开发人员可以自由使用其“蒸馏”输出来训练小众模型，加速专业领域的创新和部署周期。在短短三个月内，Llama 3.1-405B在多个关键AI基准测试中超越了当前最先进的闭源模型OpenAI GPT-4o，成为开源模型首次击败闭源大模型的里程碑。此外，Llama 3.1-405B的参数量超越了先前的Llama 3-8B和Llama 3-70B，成为Meta迄今为止最大的开源模型之一。Llama 3.1的上下文窗口达到128000个标记，约为一本50页书的长度。虽然Llama 3.1在某些MMLU和GPQA测试中略逊于GPT-4o，但在IFEval、GSM8K、ARC Challenge和Nexus测试中表现突出。Llama 3.1-405B的开源特性，将有助于促进AI领域的创新，加速模型的开发和应用，同时推动AI伦理和数据隐私的讨论。 Llama 3.1-405B的发布正值AI领域竞争激烈之际，Meta团队表示即将推出的指令调整版本将进一步提升模型性能。此外，Llama 4模型已经在6月开始训练，训练数据来源于社交平台Facebook和Instagram用户的公开帖子。Meta已向数据隐私监管最严格的欧盟地区用户发送超过20亿条通知，并提供选择不将自己的数据用于大模型训练的选项。此消息对全球AI开发人员和研究者而言，是一个重要且具有里程碑意义的事件，预示着开源AI的发展将更加开放和透明，同时也引发了对数据隐私和伦理问题的深入思考。

原文链接

本文链接：https://kx.umi6.com/article/3978.html

转载请注明文章出处

Llama 3.1