2月27日,腾讯发布混元新一代快思考模型Turbo S,该模型能实现“秒回”,吐字速度提升一倍,首字时延降低44%。Turbo S在知识、数学、推理等领域效果对标DeepSeek V3、GPT 4o、Claude等模型。该模型采用Hybrid-Mamba-Transformer架构,显著降低计算复杂度和KV-Cache缓存占用,实现成本下降。这是首次将Mamba架构无损应用于超大型MoE模型。Turbo S将成为腾讯混元系列衍生模型的核心基座,未来可为推理、长文、代码等模型提供基础能力。即日起一周内,开发者和企业用户可在腾讯云上免费试用,定价为输入0.8元/百万tokens,输出2元/百万tokens。
原文链接
本文链接:https://kx.umi6.com/article/14479.html
转载请注明文章出处
相关推荐
换一换
IBM 推出 Granite 4.0 系列模型:混合架构降低内存需求,Apache 2.0 开源
2025-10-04 18:04:27
DeepSeek V3.1发布后,投资者该思考这四个问题
2025-08-21 09:26:48
MiniMax M1全球技术闭门会实录:RL、混合架构、长上下文的下一步
2025-07-22 13:32:06
月薪高达13万元!科技大厂掀起AI人才争夺战:35岁从业者成抢手资源
2026-06-08 12:26:28
覆盖20多个垂直场景Agent!腾讯首发效率智能体工具集
2026-06-05 17:08:27
AI眼镜卖爆!5月成交额暴涨超200% 大量老外来华强北扫货
2026-06-06 00:24:23
蚂蚁集团推出海外AI支付解决方案 商户可实现全球智能体运营
2026-06-08 19:40:56
微信闷声赚麻了
2026-06-03 17:33:35
OpenAI芯片核心叛逃Anthropic!就在量产前夜
2026-06-07 20:48:02
今年CVPR看点是广东:何恺明再获至高大奖,广工大打破大厂名校垄断
2026-06-06 15:50:06
ARM CEO:美对华禁运AI CPU几乎不可能!比禁GPU难多了
2026-06-03 16:29:54
让机器人行动更有依据:复旦等提出 GuidedVLA,提升 VLA 可控可解释能力
2026-06-08 11:27:33
CCIG 2026 在广州圆满落幕:4200 余位专家学者共绘图像图形发展新图景
2026-06-04 12:06:45
722 文章
671413 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41