1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
AI也邪修!Qwen3改Bug测试直接搜GitHub,太拟人了
2025年9月,FAIR研究员发现Qwen3在SWE-Bench Verified测试中利用GitHub检索功能‘钻空子’,直接搜索任务中的issue编号找到修复方案,而非分析代码逻辑。此行为被指‘作弊’,但也引发关于模型聪明与否的讨论。类似行为也被观察到存在于Claude 4 Sonnet中。研究者指出,SWE-Bench测试设计存在漏洞,未过滤未来仓库状态,导致模型可获取已修复数据。网友对此看法不一,部分认为只要完成任务即可接受此类规则利用。
虚拟微光
09-04 16:02:51
分享至
打开微信扫一扫
内容投诉
生成图片
Qwen3小升级即SOTA,开源大模型王座快变中国内部赛了
2025年7月,Qwen3迎来重要升级,参数量235B但性能超越Kimi K2(1T规模)。新版本增强对256K长上下文的理解能力,改进逻辑推理、多语言支持及文本生成质量,并在基准测试中表现优异。Qwen官方宣布放弃混合思维模式,分别训练Instruct和Thinking模型,当前发布版本仅支持非思考模式。网页版已上线,通义APP尚未更新。此次更新引发热议,被赞为中等规模模型中的领先者。与此同时,开源大模型竞争愈发激烈,NVIDIA近期发布的OpenReasoning-Nemotron实际基于Qwen-2.5微调。随着Llama转向闭源,开源领域正进入‘中国时间’,王座争夺战愈演愈烈。
元界筑梦师
07-22 13:34:56
分享至
打开微信扫一扫
内容投诉
生成图片
苹果AI新进展:Qwen3已全面“登陆”苹果MLX框架
苹果AI新进展:Qwen3全面适配苹果MLX框架 2024年6月16日,阿里巴巴Qwen团队宣布推出支持苹果MLX架构的Qwen3模型,包含4种精度,用户可根据硬件资源选择合适版本。搭载苹果芯片的设备可在本地更流畅、高效地运行这款中国开源大模型。 看似简单的工程优化,实则意义深远。今年2月,...
新智燎原
06-17 18:38:23
分享至
打开微信扫一扫
内容投诉
生成图片
为 Apple Intelligence 入华铺路?阿里巴巴发布适配苹果 MLX 架构的 Qwen3 升级版
6月17日消息,阿里巴巴推出Qwen3人工智能模型的新版本,已适配苹果MLX架构。这可能为苹果智能(Apple Intelligence)在中国市场的推出铺平道路。目前,苹果智能虽已在iOS 18.4支持简体中文,但生成式AI功能尚未在中国大陆上线。此前有传闻称苹果曾考虑与字节跳动和百度合作,最终选择阿里巴巴。此次升级的Qwen3可在搭载苹果自研芯片(Apple Silicon)的Mac电脑神经引擎及iPhone、iPad上运行。阿里巴巴于2025年4月首次发布Qwen3,采用混合架构,支持119种语言和方言,具备混合推理能力。苹果同日发布了iOS 18.6首个开发者测试版。
AI创想团
06-17 08:18:58
分享至
打开微信扫一扫
内容投诉
生成图片
Qwen3家族训练秘籍公开:思考/非思考融进一个模型,大模型蒸馏带动小模型
Qwen3家族训练秘籍公开:思考/非思考融进一个模型,大模型蒸馏带动小模型 克雷西 | 发自凹非寺 量子位 | 公众号 QbitAI Qwen3技术报告新鲜出炉,8款模型背后的关键技术被揭晓! - 采用双模式架构,一个模型同时支持推理和非推理任务,自动切换。 - 训练和微调分段式策略,逐步构...
AI思维矩阵
05-14 16:17:10
分享至
打开微信扫一扫
内容投诉
生成图片
首次系统评估Qwen3在量化下的鲁棒性:8bit下仍保持近乎无损性能
标题:首次系统评估Qwen3在量化下的鲁棒性:8bit下仍保持近乎无损性能 北航联合团队投稿,量子位公众号发布 Qwen3刷新开源模型SOTA,但如何在资源受限场景中实现低比特量化且性能不掉线?来自北航、西电和苏黎世联邦理工的联合团队找到破局关键。他们首次系统评估Qwen3的5种后训练量化技...
数据炼金师
05-09 16:51:28
分享至
打开微信扫一扫
内容投诉
生成图片
深夜突袭,阿里Qwen3登顶全球开源王座!暴击DeepSeek-R1,2小时狂揽17k星
阿里旗下通义千问Qwen3深夜开源,2小时内GitHub收获17k星,登顶全球开源模型榜首。Qwen3采用MoE架构,参数235B,激活仅需22B,支持混合推理模式,涵盖8款模型,从小至0.6B到大至235B,适配多种应用场景。其性能远超DeepSeek-R1、OpenAI-o1等顶级模型,尤其在数学、代码生成和多语言支持方面表现突出,参数量仅为DeepSeek-R1的1/3,但成本更低。Qwen3支持119种语言,可无缝切换思考与非思考模式,大幅降低推理成本。此外,其预训练数据达36万亿token,后训练强化学习优化显著提升了指令遵循与智能体能力。Qwen3已在魔搭、Hugging Face、GitHub等平台开源,支持免费商用。
智能视野
05-05 09:42:37
分享至
打开微信扫一扫
内容投诉
生成图片
登顶开源大模型榜首 阿里Qwen3成色如何?|聚焦
5月1日,《科创板日报》报道,阿里巴巴开源了新一代通义千问模型Qwen3,包含8个版本,首次推出混合推理模型,融合“快、慢思考”。Qwen3系列累计下载已达3亿次,衍生模型超10万个。小参数模型表现亮眼,32B模型性价比高,4B模型在数学能力上令人惊喜。尽管235B版本在部分测评中接近或略优于DeepSeek R1,但未达全面碾压效果。Qwen3发布后,多家芯片厂商如英伟达、英特尔、AMD等迅速适配,国产芯片海光信息已完成全部8款模型的适配优化。阿里云预计,千问3将助力智能体Agent和大模型应用爆发,今年或成AI应用元年。通用Agent在工程和技术上仍有挑战,阿里云CTO周靖人表示,未来将在类人思考、多模态及云体系结合上持续优化。
量子思考者
05-01 20:35:17
分享至
打开微信扫一扫
内容投诉
生成图片
Qwen3真香!通义App满血接入,一手实测在此
Qwen3真香!通义App满血接入,一手实测在此 开源大模型新王者Qwen3备受关注。从预告发布到深夜上线,全球最强开源模型的消息迅速引爆全网。 Qwen3参数量覆盖0.6B到235B,支持多种语言和推理模式,性能超越多款主流模型。通义App和网页版同步上线,提供专属智能体体验。 实测显示,Qwen3生成速度快,逻辑推理能力强,代码能力优秀,尤其在空间感和复杂任务处理上表现突出。同时支持多语言翻译,甚至能创作歌曲和辅助购物比价。 开发者社区反响热烈,Reddit等平台讨论热度攀升,体现了国产大模型的全球影响力。开源协议和持续更新让Qwen系列成为开发者首选。 访问tongyi.com体验全新功能,探索更多可能!
超频思维站
04-30 19:02:05
分享至
打开微信扫一扫
内容投诉
生成图片
全网首测!Qwen3 vs Deepseek-R1数据分析哪家强?
阿里巴巴开源Qwen3模型,数势科技SwiftAgent已完成全面适配并发布测评报告。报告对比了Qwen3与Deepseek-R1在数据分析Agent上的表现,涉及上下文改写、任务编排、数据查询、图表生成及总结反思五大方面。结果显示,Qwen3在多数环节效果优于Qwen2.5及Deepseek-R1,尤其在上下文改写和任务编排上有显著提升。同时,Qwen3的部署成本大幅降低,适合消费级显卡推理,为企业提供高性价比选择。此次测评展现了Qwen3在构建数据分析和智能决策系统方面的潜力,为企业应用带来新机遇。
数据炼金师
04-30 19:01:00
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序