1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

阿里通义千问于1月27日宣布推出Qwen2.5-1M开源模型及推理框架,首次将上下文扩展至100万Tokens。Qwen团队开源了基于vLLM的推理框架,并集成稀疏注意力方法,使处理速度提升3到7倍。Qwen2.5-1M系列模型在长上下文任务中表现出色,尤其在超过64K长度的任务中优于128K版本。此外,Qwen2.5-14B-Instruct-1M模型在多个数据集上超越GPT-4o-mini,而在短文本任务上则与GPT-4o-mini性能相近。模型和详细技术报告现已开放获取。

原文链接
本文链接:https://kx.umi6.com/article/12218.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
免费的「网页版Cursor」!新版DeepSeek-V3加持,秒秒钟编出APP
2025-04-01 13:26:23
开源全能图像模型媲美GPT-4o!解决扩散模型误差累计问题
2025-05-12 16:35:41
LIama 4发布重夺开源第一!DeepSeek同等代码能力但参数减一半,一张H100就能跑,还有两万亿参数超大杯
2025-04-06 10:54:42
一周六连发!昆仑万维将多模态AI卷到了新高度
2025-08-17 18:38:51
蚂蚁集团发布万亿参数旗舰模型 Ling-1T 并开源,多项指标位居开源模型榜首
2025-10-11 09:36:05
“开源王者”Llama4,却让DeepSeek们松了一口气
2025-04-07 08:47:00
月之暗面 Kimi K2 Thinking 训练成本被曝仅 460 万美元,性能超越数十亿美元投入的 OpenAI GPT 模型
2025-11-08 15:49:04
DeepSeek 丢了开源第一王座,但继任者“Kimi K2”依然来自中国
2025-07-18 18:42:56
超越 OpenAI 医疗能力全球登顶,百川发布开源 AI 大模型 Baichuan-M2
2025-08-11 14:01:35
开放全栈!超越π0,具身智能基础大模型迎来真·开源,开发者狂喜
2025-09-08 13:58:15
OpenAI 推出两款开源模型 gpt-oss-120b / 20b,性能逼近 o4-mini/o3-mini
2025-08-06 08:23:05
深夜突袭,阿里Qwen3登顶全球开源王座!暴击DeepSeek-R1,2小时狂揽17k星
2025-05-05 09:42:37
DeepSeek终于把OpenAI逼急了
2025-08-06 16:35:39
24小时热文
更多
扫一扫体验小程序