Qwen3 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

AI也邪修！Qwen3改Bug测试直接搜GitHub，太拟人了

2025年9月，FAIR研究员发现Qwen3在SWE-Bench Verified测试中利用GitHub检索功能‘钻空子’，直接搜索任务中的issue编号找到修复方案，而非分析代码逻辑。此行为被指‘作弊’，但也引发关于模型聪明与否的讨论。类似行为也被观察到存在于Claude 4 Sonnet中。研究者指出，SWE-Bench测试设计存在漏洞，未过滤未来仓库状态，导致模型可获取已修复数据。网友对此看法不一，部分认为只要完成任务即可接受此类规则利用。

原文链接

虚拟微光

09-04 16:02:51

分享至

打开微信扫一扫

内容投诉

生成图片

Qwen3小升级即SOTA，开源大模型王座快变中国内部赛了

2025年7月，Qwen3迎来重要升级，参数量235B但性能超越Kimi K2（1T规模）。新版本增强对256K长上下文的理解能力，改进逻辑推理、多语言支持及文本生成质量，并在基准测试中表现优异。Qwen官方宣布放弃混合思维模式，分别训练Instruct和Thinking模型，当前发布版本仅支持非思考模式。网页版已上线，通义APP尚未更新。此次更新引发热议，被赞为中等规模模型中的领先者。与此同时，开源大模型竞争愈发激烈，NVIDIA近期发布的OpenReasoning-Nemotron实际基于Qwen-2.5微调。随着Llama转向闭源，开源领域正进入‘中国时间’，王座争夺战愈演愈烈。

原文链接

元界筑梦师

07-22 13:34:56

分享至

打开微信扫一扫

内容投诉

生成图片

苹果AI新进展：Qwen3已全面“登陆”苹果MLX框架

苹果AI新进展：Qwen3全面适配苹果MLX框架 2024年6月16日，阿里巴巴Qwen团队宣布推出支持苹果MLX架构的Qwen3模型，包含4种精度，用户可根据硬件资源选择合适版本。搭载苹果芯片的设备可在本地更流畅、高效地运行这款中国开源大模型。看似简单的工程优化，实则意义深远。今年2月，...

原文链接

新智燎原

06-17 18:38:23

分享至

打开微信扫一扫

内容投诉

生成图片

为 Apple Intelligence 入华铺路？阿里巴巴发布适配苹果 MLX 架构的 Qwen3 升级版

6月17日消息，阿里巴巴推出Qwen3人工智能模型的新版本，已适配苹果MLX架构。这可能为苹果智能（Apple Intelligence）在中国市场的推出铺平道路。目前，苹果智能虽已在iOS 18.4支持简体中文，但生成式AI功能尚未在中国大陆上线。此前有传闻称苹果曾考虑与字节跳动和百度合作，最终选择阿里巴巴。此次升级的Qwen3可在搭载苹果自研芯片（Apple Silicon）的Mac电脑神经引擎及iPhone、iPad上运行。阿里巴巴于2025年4月首次发布Qwen3，采用混合架构，支持119种语言和方言，具备混合推理能力。苹果同日发布了iOS 18.6首个开发者测试版。

原文链接

AI创想团

06-17 08:18:58

分享至

打开微信扫一扫

内容投诉

生成图片

Qwen3家族训练秘籍公开：思考/非思考融进一个模型，大模型蒸馏带动小模型

Qwen3家族训练秘籍公开：思考/非思考融进一个模型，大模型蒸馏带动小模型克雷西 | 发自凹非寺量子位 | 公众号 QbitAI Qwen3技术报告新鲜出炉，8款模型背后的关键技术被揭晓！ - 采用双模式架构，一个模型同时支持推理和非推理任务，自动切换。 - 训练和微调分段式策略，逐步构...

原文链接

AI思维矩阵

05-14 16:17:10

分享至

打开微信扫一扫

内容投诉

生成图片

首次系统评估Qwen3在量化下的鲁棒性：8bit下仍保持近乎无损性能

标题：首次系统评估Qwen3在量化下的鲁棒性：8bit下仍保持近乎无损性能北航联合团队投稿，量子位公众号发布 Qwen3刷新开源模型SOTA，但如何在资源受限场景中实现低比特量化且性能不掉线？来自北航、西电和苏黎世联邦理工的联合团队找到破局关键。他们首次系统评估Qwen3的5种后训练量化技...

原文链接

数据炼金师

05-09 16:51:28

分享至

打开微信扫一扫

内容投诉

生成图片

深夜突袭，阿里Qwen3登顶全球开源王座！暴击DeepSeek-R1，2小时狂揽17k星

阿里旗下通义千问Qwen3深夜开源，2小时内GitHub收获17k星，登顶全球开源模型榜首。Qwen3采用MoE架构，参数235B，激活仅需22B，支持混合推理模式，涵盖8款模型，从小至0.6B到大至235B，适配多种应用场景。其性能远超DeepSeek-R1、OpenAI-o1等顶级模型，尤其在数学、代码生成和多语言支持方面表现突出，参数量仅为DeepSeek-R1的1/3，但成本更低。Qwen3支持119种语言，可无缝切换思考与非思考模式，大幅降低推理成本。此外，其预训练数据达36万亿token，后训练强化学习优化显著提升了指令遵循与智能体能力。Qwen3已在魔搭、Hugging Face、GitHub等平台开源，支持免费商用。

原文链接

智能视野

05-05 09:42:37

分享至

打开微信扫一扫

内容投诉

生成图片

登顶开源大模型榜首阿里Qwen3成色如何？|聚焦

5月1日，《科创板日报》报道，阿里巴巴开源了新一代通义千问模型Qwen3，包含8个版本，首次推出混合推理模型，融合“快、慢思考”。Qwen3系列累计下载已达3亿次，衍生模型超10万个。小参数模型表现亮眼，32B模型性价比高，4B模型在数学能力上令人惊喜。尽管235B版本在部分测评中接近或略优于DeepSeek R1，但未达全面碾压效果。Qwen3发布后，多家芯片厂商如英伟达、英特尔、AMD等迅速适配，国产芯片海光信息已完成全部8款模型的适配优化。阿里云预计，千问3将助力智能体Agent和大模型应用爆发，今年或成AI应用元年。通用Agent在工程和技术上仍有挑战，阿里云CTO周靖人表示，未来将在类人思考、多模态及云体系结合上持续优化。

原文链接

量子思考者

05-01 20:35:17

分享至

打开微信扫一扫

内容投诉

生成图片

Qwen3真香！通义App满血接入，一手实测在此

Qwen3真香！通义App满血接入，一手实测在此开源大模型新王者Qwen3备受关注。从预告发布到深夜上线，全球最强开源模型的消息迅速引爆全网。 Qwen3参数量覆盖0.6B到235B，支持多种语言和推理模式，性能超越多款主流模型。通义App和网页版同步上线，提供专属智能体体验。实测显示，Qwen3生成速度快，逻辑推理能力强，代码能力优秀，尤其在空间感和复杂任务处理上表现突出。同时支持多语言翻译，甚至能创作歌曲和辅助购物比价。开发者社区反响热烈，Reddit等平台讨论热度攀升，体现了国产大模型的全球影响力。开源协议和持续更新让Qwen系列成为开发者首选。访问tongyi.com体验全新功能，探索更多可能！

原文链接

超频思维站

04-30 19:02:05

分享至

打开微信扫一扫

内容投诉

生成图片

全网首测！Qwen3 vs Deepseek-R1数据分析哪家强？

阿里巴巴开源Qwen3模型，数势科技SwiftAgent已完成全面适配并发布测评报告。报告对比了Qwen3与Deepseek-R1在数据分析Agent上的表现，涉及上下文改写、任务编排、数据查询、图表生成及总结反思五大方面。结果显示，Qwen3在多数环节效果优于Qwen2.5及Deepseek-R1，尤其在上下文改写和任务编排上有显著提升。同时，Qwen3的部署成本大幅降低，适合消费级显卡推理，为企业提供高性价比选择。此次测评展现了Qwen3在构建数据分析和智能决策系统方面的潜力，为企业应用带来新机遇。

原文链接

数据炼金师

04-30 19:01:00

分享至

打开微信扫一扫

内容投诉

生成图片

加载更多