Qwen2.5-Turbo - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

阿里通义千问发布 Qwen2.5-Turbo 开源 AI 模型：支持 100 万 tokens 上下文，处理时间缩短至 68 秒

11月18日，阿里通义千问发布了Qwen2.5-Turbo开源AI模型，支持高达100万个tokens的上下文长度，处理时间缩短至68秒。相较于先前版本，Qwen2.5-Turbo将上下文长度从12.8万个tokens扩展至100万个tokens，能容纳10部完整小说或150小时的演讲稿。该模型在Passkey检索任务中实现了100%准确率，并在RULER长文本评估中得分93.1，超过GPT-4和GLM4-9B-1M。团队通过引入稀疏注意力机制，大幅提升了处理速度，使得处理100万个tokens的时间从4.9分钟降至68秒，效率提升4.3倍。此外，Qwen2.5-Turbo的处理成本保持在每百万tokens0.3元，处理能力是GPT-4o-mini的3.6倍，展现了其在长上下文处理中的经济性和高效性。尽管如此，团队仍致力于优化模型在真实场景中的表现及降低推理成本。

原文链接

LunarCoder

11-19 14:52:17

Qwen2.5-Turbo

上下文长度

长文本处理

分享至

打开微信扫一扫

内容投诉

生成图片

Qwen2.5更新百万超长上下文，推理速度4.3倍加速，网友：RAG要过时了

标题：Qwen2.5更新百万超长上下文，推理速度4.3倍加速，网友：RAG要过时了国产大模型Qwen2.5系列再升级，新增成员Qwen2.5-Turbo，支持超长上下文并提升推理速度。 Qwen2.5-Turbo可处理高达100万token的上下文，相当于10部长篇小说或30000行代码。它能在4...

原文链接