Qwen2.5 - AI优秘圈

苹果联合推出 AI 交错推理方法，Qwen2.5 模型响应速度快 80%、准确率提高 19.3%

5月29日，苹果与杜克大学合作提出AI新方法——交错推理（Interleaved Reasoning），旨在提升大语言模型的推理能力。传统大语言模型在解决复杂问题时常因‘先思考后回答’模式导致响应慢且易出错。苹果团队通过引入交错推理技术，使模型边推理边输出中间答案，大幅提高了效率与准确性。实验显示，在Qwen2.5模型上，响应速度提升了80%，准确率提高19.3%。此方法仅基于问答和逻辑数据集训练，却在MATH、GPQA、MMLU等更难的任务中展现出色泛化能力。研究还探索了多种奖励机制，发现条件性和时间折扣奖励效果最优，显著优于常规方法。这项技术有望改善AI实时交互体验。

原文链接

智能涌动

05-30 14:56:13

Qwen2.5

交错推理

苹果

分享至

打开微信扫一扫

内容投诉

生成图片

标题：7B模型搞定AI视频通话，阿里最新开源炸场，看听说写全模态打通，开发者企业免费商用深夜重磅！阿里发布并开源首个端到端全模态大模型——通义千问Qwen2.5-Omni-7B。仅需一个一体化模型，就能处理文本、音频、图像、视频全模态，并实时生成文本和自然语音。该模型被称为7B模型的全能冠军。...

原文链接

量子思考者

03-27 13:46:24

Qwen2.5-Omni-7B

多模态

开源

分享至

打开微信扫一扫

内容投诉

生成图片

阿里云通义千问发布新一代端到端多模态旗舰模型 Qwen2.5-Omni 并开源，看听说写样样精通

3月27日凌晨，阿里云发布通义千问Qwen模型家族新成员——Qwen2.5-Omni，这是一款端到端多模态旗舰模型，并已在Hugging Face、ModelScope、DashScope和GitHub上开源。Qwen2.5-Omni支持文本、图像、音频和视频等多种输入形式，具备实时流式响应能力，能同时生成文本与自然语音合成输出。该模型采用了Thinker-Talker双核架构，Thinker模块处理多模态输入生成语义表征，Talker模块则负责流畅生成语音。相比同类单模态模型，Qwen2.5-Omni在多模态任务OmniBench上达到SOTA表现，并在语音识别、翻译、音频理解等多个单模态任务中表现出色。用户可通过提供的链接访问相关资源和Demo体验。

原文链接

量子黑客

03-27 07:33:35

Qwen2.5-Omni

多模态

阿里云

分享至

打开微信扫一扫

内容投诉

生成图片

阿里深夜炸场！通义千问发布新一代端到端旗舰模型Qwen2.5-Omni

北京时间3月27日凌晨，阿里巴巴推出通义千问系列新旗舰模型Qwen2.5-Omni。该端到端多模态模型可处理文本、图像、音频及视频等多种输入，具备实时流式响应能力。Qwen2.5-Omni采用全新Thinker-Talker架构，引入TMRoPE技术，提升多模态输入同步精度。其语音生成自然流畅，端到端语音指令跟随能力出色，在MMLU、GSM8K等基准测试中表现优异。模型在OmniBench多模态任务中达到SOTA表现，单模态任务中亦表现突出。目前，Qwen2.5-Omni已在Hugging Face、ModelScope、DashScope及GitHub开源。

原文链接

AI创想团

03-27 04:26:09

Qwen2.5-Omni

多模态模型

阿里通义千问

分享至

打开微信扫一扫

内容投诉

生成图片

阿里通义千问Qwen发布最新多模态模型Qwen2.5-VL-32B-Instruct，该模型具备强大的视觉语言处理能力和数学推理能力。相比之前的Qwen2.5-VL系列，32B版本在尺寸与性能间取得平衡，并支持本地运行。通过强化学习优化，模型在回答人类偏好、数学推理及图像解析等方面均有显著提升。在多个基准测试中，Qwen2.5-VL-32B的表现超越了更大规模的72B版本，甚至达到同类模型中的最佳水平。例如，它能根据交通指示牌照片精确计算卡车是否能在规定时间内到达目的地。此外，模型还展示了优秀的几何分析和复杂问题解决能力。目前，该模型已在Hugging Face开源，用户可通过Qwen Chat直接体验。值得注意的是，这已是春节以来阿里与DeepSeek几乎同时发布的又一成果，引发社区热议。

原文链接

GhostPilot

03-25 09:46:01

Qwen2.5-VL-32B

多模态模型

数学推理

分享至

打开微信扫一扫

内容投诉

生成图片

阿里将推出基于 Qwen2.5-MAX 的深度推理模型

阿里集团CEO吴泳铭在2025财年第三季度财报会上透露，阿里将于近期发布基于千问Qwen2.5-MAX的深度推理模型。1月29日，阿里云公布了全新通义千问Qwen 2.5-Max超大规模MoE模型，并在Chatbot Arena大模型盲测中以1332分位列全球第七，成为非推理类中国大模型冠军。Qwen2.5-Max在数学和编程等单项能力上排名第一，在硬提示方面排名第二，超越了DeepSeek V3、Open AI o1-mini和Claude-3.5-Sonnet等模型。

原文链接

数码游侠

02-20 21:26:21

Qwen2.5-Max

深度推理模型

阿里

分享至

打开微信扫一扫

内容投诉

生成图片

阿里云确认：李飞飞团队 s1 模型基于 Qwen2.5-32B-Instruct 模型训练

阿里云确认，李飞飞团队的s1模型基于Qwen2.5-32B-Instruct模型训练。该模型在数学和编码能力测试中表现优异，与OpenAI的o1和DeepSeek的R1模型相当。李飞飞团队仅花费不到50美元的云计算费用，在16块H100 GPU上监督微调26分钟完成训练。他们利用蒸馏技术和监督微调方法，使用一个包含1000个精心策划问题的数据集进行训练，该数据集还包含了谷歌Gemini 2.0提供的答案及其思考过程。此模型在竞赛数学问题上的表现比o1-preview高出27%。

原文链接

新智燎原

02-06 22:40:21

Qwen2.5-32B-Instruct

s1模型

李飞飞团队

分享至

打开微信扫一扫

内容投诉

生成图片

杭州超越杭州：阿里Qwen2.5-Max反超DeepSeek-V3！网友：中国AI正在快速缩小差距

阿里推出的Qwen2.5-Max在大模型竞技场榜单上超越DeepSeek-V3，以总分1332位列第七，同时超过Claude 3.5 Sonnet和Llama 3.1 405B等模型。该模型在编程和数学方面尤为突出，与满血o1及DeepSeek-R1并列第一。Chatbot Arena是全球顶级大模...

原文链接

智慧轨迹

02-04 20:42:25

ai

Qwen2.5-Max

大模型

分享至

打开微信扫一扫

内容投诉

生成图片

阿里除夕发布Qwen2.5-Max反超DeepSeek V3，一句话开发小游戏

阿里在除夕夜发布了Qwen2.5-Max，这款模型在多个基准测试中超越了DeepSeek V3。Qwen2.5-Max在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等基准测试中表现出色，整体优于DeepSeek V3、Llama-3.1-405B及闭...

原文链接

心智奇点

01-29 12:07:57

DeepSeek V3

Qwen2.5-Max

小游戏

分享至

打开微信扫一扫

内容投诉

生成图片

杭州领跑AI开源！阿里Qwen除夕开源视觉理解新旗舰，全系列3尺寸，7B模型超GPT-4o-mini

杭州领跑AI开源！阿里Qwen除夕开源视觉理解新旗舰，全系列3尺寸，7B模型超GPT-4o-mini 衡宇白交发自川渝量子位 | 公众号 QbitAI 眼看蛇年将至，杭州依旧充满活力。阿里通义Qwen今日凌晨4点发布了视觉理解模型Qwen2.5-VL，包含3B、7B和72B三个版本。Qwen...

原文链接

量子思考者

01-28 10:42:11

GPT-4o-mini

Qwen2.5-VL

视觉理解模型

分享至

打开微信扫一扫

内容投诉

生成图片