Qwen2.5 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

苹果联合推出 AI 交错推理方法，Qwen2.5 模型响应速度快 80%、准确率提高 19.3%

5月29日，苹果与杜克大学合作提出AI新方法——交错推理（Interleaved Reasoning），旨在提升大语言模型的推理能力。传统大语言模型在解决复杂问题时常因‘先思考后回答’模式导致响应慢且易出错。苹果团队通过引入交错推理技术，使模型边推理边输出中间答案，大幅提高了效率与准确性。实验显示，在Qwen2.5模型上，响应速度提升了80%，准确率提高19.3%。此方法仅基于问答和逻辑数据集训练，却在MATH、GPQA、MMLU等更难的任务中展现出色泛化能力。研究还探索了多种奖励机制，发现条件性和时间折扣奖励效果最优，显著优于常规方法。这项技术有望改善AI实时交互体验。

原文链接

智能涌动

05-30 14:56:13

分享至

打开微信扫一扫

内容投诉

生成图片

让Qwen2.5 7B超越o1，微软干的！MSRA推出小模型数学推理自我进化新方法

标题：MSRA推出rStar-Math，使Qwen2.5 7B数学推理超越o1 衡宇发自凹非寺量子位 | 公众号 QbitAI 7B参数的Qwen2.5数学推理表现超过o1-preview，靠的是MSRA的最新算法rStar-Math。该算法通过代码增强CoT、蒙特卡洛树搜索（MCTS）等技术...

原文链接

新智燎原

01-10 12:15:13

分享至

打开微信扫一扫

内容投诉

生成图片

不敢对比Qwen2.5，Mistral最强小模型陷争议，欧洲OpenAI不Open了

标题：Mistral最强小模型陷争议，欧洲OpenAI不Open了 Mistral AI发布自称为“世界上最好的边缘模型”的新模型，但陷入质疑和争议。此次发布的两款模型分别是Ministral 3B和8B，用于端侧和边缘计算。官方称这两款模型在知识、常识、推理、函数调用和效率方面有所突破。然而，M...

原文链接

AI思维矩阵

10-17 13:03:45

分享至

打开微信扫一扫

内容投诉

生成图片

阿里通义千问开源 Qwen2.5 大模型，号称性能超越 Llama

在2024年云栖大会上，阿里云CTO周靖人发布了通义千问新一代开源大模型Qwen2.5，旗舰模型Qwen2.5-72B性能宣称超越Llama。Qwen2.5涵盖多种尺寸的语言、编程和数学模型，包括0.5B至72B不等的大小，并提供基础、指令跟随和量化版本，总计超过100个模型上线。除了3B和72B版本，所有开源模型均采用Apache 2.0许可证，可在Hugging Face仓库中获取。通义千问还通过Model Studio提供了旗舰模型Qwen-Plus和Qwen-Turbo的API，并开源了性能提升后的Qwen2-VL-72B。据阿里云官方数据，通义千问开源模型累计下载量已突破4000万次，成为仅次于Llama的世界级模型群。此外，阿里云宣布通义千问推荐模型全线降价，最高降幅达85%，引发行业关注。

原文链接

数字墨迹

09-19 16:44:22

分享至

打开微信扫一扫

内容投诉

生成图片

Qwen2.5登全球开源王座！72B击败LIama3 405B，轻松胜过GPT-4o-mini

Qwen2.5登顶全球开源王座，以72B的参数规模在多任务中击败了LIama3 405B，并轻松胜过GPT-4o-mini。这一成就得益于其全面开源策略，释放了包括14B、32B以及轻量级Turbo模型在内的7个参数型号，其中六七个模型具备数学、代码能力。Qwen2.5系列在各种任务中实现了能力跃迁，尤其在数学、编码和一般任务方面表现出色。值得注意的是，Qwen2.5提供了包括数学和代码专业模型在内的全套解决方案，其中Qwen2.5-Coder和Qwen2.5-Math系列在相应领域取得了显著进展。整体而言，Qwen2.5的开源行动标志着史上最大规模的模型共享，为开发者和研究人员提供了丰富资源，推动了人工智能技术的创新和发展。

原文链接

数字墨迹

09-19 15:23:24

分享至

打开微信扫一扫

内容投诉

生成图片

加载更多