阿里通义千问于1月27日宣布推出Qwen2.5-1M开源模型及推理框架,首次将上下文扩展至100万Tokens。Qwen团队开源了基于vLLM的推理框架,并集成稀疏注意力方法,使处理速度提升3到7倍。Qwen2.5-1M系列模型在长上下文任务中表现出色,尤其在超过64K长度的任务中优于128K版本。此外,Qwen2.5-14B-Instruct-1M模型在多个数据集上超越GPT-4o-mini,而在短文本任务上则与GPT-4o-mini性能相近。模型和详细技术报告现已开放获取。
原文链接
本文链接:https://kx.umi6.com/article/12218.html
转载请注明文章出处
相关推荐
换一换
GLM-5真够顶的:超24小时自己跑代码,700次工具调用、800次切上下文!
2026-02-14 16:26:42
小米网页 AI 聊天服务惊喜亮相,MiMo-V2-Flash 模型发布、代码能力开源最强
2025-12-17 00:07:31
在史上最大规模WAIC中寻找DeepSeek
2025-07-28 09:10:59
英伟达全新开源模型:三倍吞吐、单卡可跑,还拿下推理SOTA
2025-07-29 15:31:43
字节突然开源Seed-OSS,512K上下文主流4倍长度,推理能力刷纪录
2025-08-21 14:33:12
下载超 10 亿、衍生模型破 20 万,阿里千问刷新全球开源模型纪录
2026-01-21 16:18:32
腾讯混元 0.5B、1.8B、4B、7B模型发布
2025-08-04 16:02:12
DeepSeek V4终于发布!打破最强闭源垄断,明确携手华为芯片
2026-04-24 13:09:49
B站开源动漫视频生成模型 AniSora V3 版,速度更快、质量更高
2025-07-07 08:25:15
爆火全网FLUX.2重磅上线,开源版Nano Banana来了!
2025-11-26 17:55:27
AI出海,掘金一个时代
2026-02-07 10:06:40
OpenAI 推出两款开源模型 gpt-oss-120b / 20b,性能逼近 o4-mini/o3-mini
2025-08-06 08:23:05
微博自研VibeThinker开源模型:训练成本仅7800美元
2025-11-18 15:27:09
708 文章
647975 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41