1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

Meta开源Llama 3.1,意图打造“大模型界的Linux”

Meta近期宣布开源其大参数模型Llama 3.1,此举动被视为AI领域的重要里程碑。Llama 3.1在多项基准测试中表现出色,超越了GPT-4和Anthropic的Claude 3.5 Sonnet,且预计未来几个月内,由Llama 3支持的Meta AI使用量将超过ChatGPT。

Llama 3.1的特性

  • 参数量级:拥有4050亿个模型参数,采用密集Transformer架构。
  • 数据规模:使用约15T的多语言token,远超Llama 2的1.8T。
  • 训练规模:是Llama 2的50倍,训练计算量大幅提升。
  • 架构选择:未采用MOE架构,专注于标准的密集Transformer架构。
  • 多模态能力:目前仅支持多语言、编程、推理和工具使用,图像、视频或语音处理功能仍在研发中。

Meta的AI生态系统愿景

扎克伯格将Llama视为AI领域的“Linux”,意在通过开源促进AI行业的标准化和开放性。Meta计划通过广泛、开放的生态系统,使Llama成为行业标准,支持企业、政府及个人开发者定制适合自身需求的模型。Meta已与Amazon、Databricks、英伟达等合作伙伴展开合作,提供全套服务以支持模型的微调和蒸馏。

面临的挑战

尽管Llama 3.1提供了强大的基座模型,但运行如此规模模型所需的算力和成本对大多数开发者来说仍然是巨大挑战。4050亿参数的密集模型虽免费提供,但在实际部署中,运行成本可能超过使用闭源模型。

微调与蒸馏

Meta鼓励用户通过微调和蒸馏技术,将Llama 3.1应用于特定场景,创建满足特定需求的模型。扎克伯格认为,用户应直接在4050亿参数的模型上进行推理,以节省成本,并期望看到更多基于此模型的创新应用。

商业化与未来展望

Meta的AI商业化策略侧重于改善其广告业务,并通过Meta AI助手提升用户体验,目标是在Instagram、Facebook和WhatsApp等平台上实现广泛集成。随着Llama 3.1的发布,Meta AI新增“想象我”功能,允许用户生成基于特定肖像的图像。未来,Meta AI将出现在Quest耳机中,取代原有的语音命令界面,进一步提升交互体验。

未来规划

扎克伯格透露,Llama 4和其他后续版本已在研发中,Meta正进行长期投资,包括构建数据中心、配套电力、芯片架构和网络架构等,以支撑未来AI模型的发展。

原文链接
本文链接:https://kx.umi6.com/article/3974.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
收购「Manus」也治不好大厂的焦虑症
2026-01-06 19:24:45
消息称 Meta 正就为自有数据中心导入 TPU AI 芯片与谷歌洽谈
2025-11-25 11:48:26
AI眼镜的痛,Meta也治不了
2025-09-23 11:13:00
Meta 出手,帮家长从容应对孩子“AI 聊天成瘾”
2025-10-20 08:59:04
近300亿美元!Meta即将落实创纪录私人融资交易支持数据中心建设
2025-10-17 16:29:28
“AI争霸”格局大变:Alphabet被热捧Meta却坐冷板凳,为何?
2025-10-31 16:40:59
Meta 全新 AI 模型“牛油果”开发内幕:消息称扎克伯格亲自抓,阿里 Qwen 模型参与蒸馏
2025-12-11 00:15:55
Meta 计划收购 RISC-V 企业 Rivos,增强 AI 芯片技术堆栈
2025-10-02 09:06:19
“华尔街之狼”重仓押注Meta约20亿美元
2026-02-12 16:32:04
投资界24h | 长鑫科技递表,巨无霸IPO来了;孙正义,一笔重仓400亿美元;Manus卖身背后:将清退所有中资
2025-12-31 13:22:23
Meta削减人工智能部门约600个职位,精简架构以加速组织转型
2025-10-23 02:55:30
Meta 请求法院驳回“非法下载色情内容训练 AI”诉讼,称下载属个人行为与 AI 训练无关
2025-10-30 12:41:24
Meta的尴尬时刻:首款带屏AI+AR眼镜发布却两度“翻车” AR热潮会否开启?
2025-09-18 13:54:27
24小时热文
更多
扫一扫体验小程序