1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

阿里通义千问于1月27日宣布推出Qwen2.5-1M开源模型及推理框架,首次将上下文扩展至100万Tokens。Qwen团队开源了基于vLLM的推理框架,并集成稀疏注意力方法,使处理速度提升3到7倍。Qwen2.5-1M系列模型在长上下文任务中表现出色,尤其在超过64K长度的任务中优于128K版本。此外,Qwen2.5-14B-Instruct-1M模型在多个数据集上超越GPT-4o-mini,而在短文本任务上则与GPT-4o-mini性能相近。模型和详细技术报告现已开放获取。

原文链接
本文链接:https://kx.umi6.com/article/12218.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
95后小伙手搓AI眼镜:盲道、红绿灯都可认出 成本仅百元
2025-10-24 12:39:22
MiniMax发布全球首个混合架构开源模型M1 称强化训练成本仅53万美金
2025-06-17 19:29:56
字节Seed首次开源代码模型,拿下同规模多个SOTA,提出用小模型管理数据范式
2025-05-11 13:19:07
华为盘古 Ultra-MoE-718B-V1.1 正式开源并开放下载,模型权重与技术细节全面公开
2025-10-16 17:57:55
开源模型三城记
2025-07-30 10:43:17
群核科技升级空间智能战略,发布两款空间开源模型
2025-08-25 17:31:32
谷歌前 CEO 施密特称中国领先的大模型皆为开源,呼吁中美开展合作
2025-07-26 16:43:43
英伟达全新开源模型:三倍吞吐、单卡可跑,还拿下推理SOTA
2025-07-29 15:31:43
全球闲置算力训个模型,性能媲美R1,老黄“天塌了”
2025-05-16 14:29:01
100万亿Token揭示今年AI趋势,硅谷的这份报告火了
2025-12-09 14:39:59
对话朱啸虎:搬离中国,假装不是中国AI创业公司,是没有用的
2025-09-20 20:35:10
DeepSeek新版R1直追OpenAI o3!实测来了:“小版本升级”着实不小
2025-05-29 11:14:38
刷新复杂Agent推理记录!阿里通义开源网络智能体超越DeepSeek R1,Grok-3
2025-07-07 17:32:00
24小时热文
更多
扫一扫体验小程序