2月27日,腾讯发布混元新一代快思考模型Turbo S,该模型能实现“秒回”,吐字速度提升一倍,首字时延降低44%。Turbo S在知识、数学、推理等领域效果对标DeepSeek V3、GPT 4o、Claude等模型。该模型采用Hybrid-Mamba-Transformer架构,显著降低计算复杂度和KV-Cache缓存占用,实现成本下降。这是首次将Mamba架构无损应用于超大型MoE模型。Turbo S将成为腾讯混元系列衍生模型的核心基座,未来可为推理、长文、代码等模型提供基础能力。即日起一周内,开发者和企业用户可在腾讯云上免费试用,定价为输入0.8元/百万tokens,输出2元/百万tokens。
原文链接
本文链接:https://kx.umi6.com/article/14479.html
转载请注明文章出处
相关推荐
换一换
IBM 推出 Granite 4.0 系列模型:混合架构降低内存需求,Apache 2.0 开源
2025-10-04 18:04:27
腾讯混元新一代快思考模型 Turbo S 发布,支持“秒回”
2025-02-27 18:34:34
MiniMax M1全球技术闭门会实录:RL、混合架构、长上下文的下一步
2025-07-22 13:32:06
DeepSeek V3.1发布后,投资者该思考这四个问题
2025-08-21 09:26:48
不再被微软“绑架”!大神出手:全新脚本卸载所有Windows AI功能
2025-12-10 12:48:33
美国多家银行:AI 显著提升生产力,部分岗位面临裁撤风险
2025-12-10 12:47:26
为什么 Google 一直是你大爷?
2025-12-10 14:52:11
广州车展小鹏展台现低俗视频!小鹏法务部:利用AI生成造谣的人已被拘留
2025-12-10 18:02:56
ChatGPT 变身“修图师”,OpenAI 宣布接入 Adobe Photoshop、Acrobat
2025-12-10 22:10:04
《阿凡达3》中国首映 导演卡梅隆:AI永远无法替代人的创作
2025-12-09 22:01:39
专注智能网联汽车,北斗智联完成数亿元B轮战略融资
2025-12-10 11:42:07
发货周期拉长至45天 夸克AI眼镜官方客服:紧急增产备货
2025-12-10 19:06:00
腾讯混元大模型品牌 Hunyuan 更名为 HY
2025-12-10 15:53:58
606 文章
372513 浏览
24小时热文
更多
-
2025-12-11 00:19:01 -
2025-12-11 00:15:55 -
2025-12-10 23:15:05