美国时间周六,Meta紧急发布了Llama 4系列模型,包括Llama 4 Scout、Maverick和Behemoth三款。Llama 4 Scout参数量达1090亿,适合单个Nvidia H100 GPU运行;Maverick参数量4000亿,表现均衡;Behemoth参数量近2万亿,擅长STEM领域任务。Llama 4首次采用混合专家架构,原生支持多模态数据处理。Meta因竞争对手可能发布更强多模态模型而提前发布,但Benchmark榜单不够全面,Reasoning Model未同步推出。尽管如此,Llama 4展示了强大算力对模型发展的推动作用,再次证明了算力为核心竞争力的地位。
原文链接
本文链接:https://kx.umi6.com/article/16756.html
转载请注明文章出处
相关推荐
.png)
换一换
DeepSeek终于丢了开源第一王座,但继任者依然来自中国
2025-07-18 17:42:26
对话智源研究院王仲远:做具身智能的“安卓系统”,而非专用的“iOS”
2025-06-07 10:47:30
阿里千问3下载量破千万!衍生模型数超13万稳居全球第一
2025-06-09 13:26:05
GPT-5信息大量泄露,四个版本全曝光,免费用户也能用,还有一个神秘功能
2025-08-07 18:55:45
OpenAI再次推迟发布开源模型
2025-07-14 08:16:03
让64张卡像一张卡!浪潮信息发布新一代AI超节点,支持四大国产开源模型同时运行
2025-08-11 16:03:42
微软将 OpenAI 最小开源模型 gpt-oss-20b 引入 Windows,本地也能跑
2025-08-07 11:47:50
业界首个:腾讯混元-A13B 模型发布并开源,极端条件 1 张中低端 GPU 卡即可部署
2025-06-27 17:10:33
抢跑GPT-5,智谱开源新SOTA模型,一句话搞出能看视频、发弹幕的B站!
2025-07-29 00:21:11
“开源模型验货官”Perplexity,给Kimi K2盖了个戳
2025-07-21 11:17:17
中国AI凭什么逆袭美国?
2025-06-26 13:58:23
群核科技升级空间智能战略,发布两款空间开源模型
2025-08-25 17:31:32
Kimi超过DeepSeek的新模型被指“套壳”Qwen?到底怎么回事儿
2025-06-18 21:42:36
472 文章
159544 浏览
24小时热文
更多

-
2025-09-06 16:37:17
-
2025-09-06 16:36:53
-
2025-09-06 16:36:08