2月21-23日,2025全球开发者先锋大会在上海召开。MiniMax副总裁刘华分享了多模态大模型发展的见解。他指出,尽管Transformer架构推动了大语言模型的发展,但处理长文本时算力消耗呈平方关系增长。未来,MiniMax将转向稀疏架构和非Transformer架构的研究,以降低算力消耗。2024年OpenAI推出的Sora和GPT4o展示了视频、语音模型的新能力,大模型在未来两到三年内仍有重大突破可能。MiniMax将致力于构建多模态开源生态,以精细研发团队提升技术上限。
原文链接
本文链接:https://kx.umi6.com/article/14102.html
转载请注明文章出处
相关推荐
换一换
全球四项第一!优必选自研人形机器人最强大脑Thinker登顶全球
2025-09-09 12:12:13
阶跃星辰走“窄门”
2025-06-12 22:41:52
万亿赛道的具身智能,到底是什么?
2025-03-24 20:14:12
CVPR2025视频生成统一评估架构,上交x斯坦福联合提出让MLLM像人类一样打分
2025-06-12 17:39:33
上海AI实验室开源通用多模态大模型书生·万象3.5
2025-09-03 20:52:29
上海人工智能实验室开源多模态大模型“书生・万象 3.0”:能同时处理文本和多模态输入
2025-04-17 13:36:40
非 Transformer 架构 AI 模型 Liquid 问世,号称性能“凌驾 Meta Llama / 微软 Phi”
2024-10-09 09:45:15
多模态通用感知能力超越 GPT-5,上海 AI 实验室开源书生・万象 3.5 大模型
2025-09-03 21:51:48
事关下一代大模型!斯坦福顶尖1%科学家许主洪加盟阿里通义
2025-09-30 12:26:16
上海人工智能实验室开源多模态大模型书生·万象3.0
2025-04-17 12:40:23
基于能量的Transformer横空出世!全面超越主流模型35%
2025-07-08 17:50:48
阶跃星辰多模态大模型为OPPO新机提供技术支持
2025-04-22 16:25:15
多模态大模型事实正确性评估:o1最强,模型普遍过于自信,最擅长现代建筑/工程技术/科学
2025-02-23 14:57:45
643 文章
463392 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18