1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

阿里通义千问于1月27日宣布推出Qwen2.5-1M开源模型及推理框架,首次将上下文扩展至100万Tokens。Qwen团队开源了基于vLLM的推理框架,并集成稀疏注意力方法,使处理速度提升3到7倍。Qwen2.5-1M系列模型在长上下文任务中表现出色,尤其在超过64K长度的任务中优于128K版本。此外,Qwen2.5-14B-Instruct-1M模型在多个数据集上超越GPT-4o-mini,而在短文本任务上则与GPT-4o-mini性能相近。模型和详细技术报告现已开放获取。

原文链接
本文链接:https://kx.umi6.com/article/12218.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
超越 DeepSeek-R1,英伟达开源模型 Llama-Nemotron 登顶
2025-05-06 17:56:45
威胁还是机遇?DeepSeek的崛起对全球AI芯片行业影响几何
2025-02-07 18:06:02
单卡搞定万帧视频理解!智源研究院开源轻量级超长视频理解模型Video-XL-2
2025-06-04 14:20:36
OpenAI再次推迟发布开源模型
2025-07-14 08:16:03
OpenAI对标DeepSeek的开源模型,本周就要来了?
2025-04-14 13:32:36
开源全能图像模型媲美GPT-4o!解决扩散模型误差累计问题
2025-05-12 16:35:41
DeepSeek,搅了谁的局?
2025-02-10 09:01:15
李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280
2025-04-08 23:18:28
阿里云魔搭社区:首发阶跃星辰最新开源两款多模态模型 已上架超4万个开源模型
2025-02-21 13:58:38
全球最大开源视频模型,现在也Created in China了,阶跃出品
2025-02-19 14:50:40
DeepSeek 丢了开源第一王座,但继任者“Kimi K2”依然来自中国
2025-07-18 18:42:56
DeepSeek低调宣称小更新,结果用2折价格达到R1水平
2025-03-25 17:07:03
腾讯推出智能体开发平台并计划开源多个模型
2025-05-21 11:01:38
24小时热文
更多
扫一扫体验小程序