欧洲OpenAI与"Transformer挑战者"合作,Mistral AI推出基于Mamba2架构的开源代码生成模型Codestral Mamba(7B),支持无限长度输入。该模型在256k token上下文中超越了多个7B和34B规模的代码生成模型。Mistral AI同时发布了数学模型Mathstral(7B),专注于STEM领域,且表现出在数学问题解决上的优势。Mamba初代论文虽曾被ICLR拒稿,但已被CoLM2024会议接收,显示Mamba架构的革新影响力。
原文链接
本文链接:https://kx.umi6.com/article/3500.html
转载请注明文章出处
相关推荐
换一换
Mamba一作预告新架构!长文论述Transformer≠最终解法
2025-07-09 14:03:28
Mamba写代码真的超越Transformer!原始论文入选顶流新会议
2024-07-17 17:07:05
苹果AI选Mamba:Agent任务比Transformer更好
2025-10-21 14:27:27
多亏Transformer,Mamba更强了!仅用1%计算量达新SOTA
2024-08-22 17:19:58
LIama 3+Mamba强强联手!蒸馏到线性RNN,推理速度提升1.6倍
2024-09-10 19:13:45
豆包手机助手:已下线操作银行、互联网支付类APP的能力
2025-12-06 18:44:32
重庆“十五五”规划建议:建设“人工智能+”市域开源新生态 迭代完善人工智能政策体系
2025-12-08 08:18:03
张予彤出任月之暗面总裁
2025-12-08 19:45:13
8 年首次大突破:谷歌祭出 Transformer 杀手,掌门人划出 AGI 死线
2025-12-07 15:34:40
微软终于听劝一次!Windows 11右键菜单AI操作可彻底移除
2025-12-08 12:28:38
AI将冲击几乎所有工作!麦肯锡预测:全球高达8亿个岗位会被取代
2025-12-08 11:24:37
硅片,洗牌进行时
2025-12-07 14:30:16
罗永浩谈豆包手机被部分App封杀:事情比想象的要复杂得多
2025-12-08 11:26:56
614 文章
356015 浏览
24小时热文
更多
-
2025-12-08 22:52:38 -
2025-12-08 22:51:57 -
2025-12-08 22:51:33