欧洲OpenAI与"Transformer挑战者"合作,Mistral AI推出基于Mamba2架构的开源代码生成模型Codestral Mamba(7B),支持无限长度输入。该模型在256k token上下文中超越了多个7B和34B规模的代码生成模型。Mistral AI同时发布了数学模型Mathstral(7B),专注于STEM领域,且表现出在数学问题解决上的优势。Mamba初代论文虽曾被ICLR拒稿,但已被CoLM2024会议接收,显示Mamba架构的革新影响力。
原文链接
本文链接:https://kx.umi6.com/article/3500.html
转载请注明文章出处
相关推荐
换一换
Mamba写代码真的超越Transformer!原始论文入选顶流新会议
2024-07-17 17:07:05
苹果AI选Mamba:Agent任务比Transformer更好
2025-10-21 14:27:27
Mamba一作预告新架构!长文论述Transformer≠最终解法
2025-07-09 14:03:28
多亏Transformer,Mamba更强了!仅用1%计算量达新SOTA
2024-08-22 17:19:58
LIama 3+Mamba强强联手!蒸馏到线性RNN,推理速度提升1.6倍
2024-09-10 19:13:45
最高法:打击滥用AI换脸等行为 斩断为电诈提供“技术助攻”的链条
2026-03-09 15:54:50
高中生AI创业,现在只招龙虾员工:每月成本2800
2026-03-08 18:28:34
无需排队工业级漫剧制作:360纳米漫剧流水线抢跑AI影视工业化
2026-03-06 10:46:51
因拒绝美军方不受限制地使用其AI模型 美国一科技公司被列入“黑名单”
2026-03-06 20:35:09
苏州人工智能专项母基金等成立投资合伙企业 出资额5亿
2026-03-06 17:22:54
深圳龙岗拟出台措施 支持OpenClaw&OPC发展
2026-03-08 17:26:26
无垠拓界 基筑未来|无问智科重磅发布业界首个物理AI数据基座平台
2026-03-06 15:07:52
GPT-5.4发布:OpenAI首个大一统模型,简直是龙虾原生
2026-03-06 09:42:29
690 文章
482913 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18