
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
苹果AI新进展:Qwen3全面适配苹果MLX框架
2024年6月16日,阿里巴巴Qwen团队宣布推出支持苹果MLX架构的Qwen3模型,包含4种精度,用户可根据硬件资源选择合适版本。搭载苹果芯片的设备可在本地更流畅、高效地运行这款中国开源大模型。
看似简单的工程优化,实则意义深远。今年2月,...
原文链接
6月17日消息,阿里巴巴推出Qwen3人工智能模型的新版本,已适配苹果MLX架构。这可能为苹果智能(Apple Intelligence)在中国市场的推出铺平道路。目前,苹果智能虽已在iOS 18.4支持简体中文,但生成式AI功能尚未在中国大陆上线。此前有传闻称苹果曾考虑与字节跳动和百度合作,最终选择阿里巴巴。此次升级的Qwen3可在搭载苹果自研芯片(Apple Silicon)的Mac电脑神经引擎及iPhone、iPad上运行。阿里巴巴于2025年4月首次发布Qwen3,采用混合架构,支持119种语言和方言,具备混合推理能力。苹果同日发布了iOS 18.6首个开发者测试版。
原文链接
6月6日凌晨,阿里开源了Qwen3-Embedding系列模型(包括Embedding及Reranker),专为文本表征、检索与排序任务设计。该系列基于Qwen3基础模型训练,在多项基准测试中表现卓越。8B参数规模的Embedding模型在MTEB多语言Leaderboard榜单中得分70.58,位居第一(截至2025年6月6日)。Qwen3-Embedding支持0.6B到8B参数的三种配置,具备灵活架构与多语言支持,覆盖超100种语言,且支持代码检索。Embedding模型通过“EOS”标记生成语义表示,Reranker则计算文本对相关性得分。模型还支持表征维度自定义与指令适配优化。开源地址包括ModelScope、Hugging Face及GitHub。
原文链接
Qwen3家族训练秘籍公开:思考/非思考融进一个模型,大模型蒸馏带动小模型
克雷西 | 发自凹非寺
量子位 | 公众号 QbitAI
Qwen3技术报告新鲜出炉,8款模型背后的关键技术被揭晓!
- 采用双模式架构,一个模型同时支持推理和非推理任务,自动切换。
- 训练和微调分段式策略,逐步构...
原文链接
标题:首次系统评估Qwen3在量化下的鲁棒性:8bit下仍保持近乎无损性能
北航联合团队投稿,量子位公众号发布
Qwen3刷新开源模型SOTA,但如何在资源受限场景中实现低比特量化且性能不掉线?来自北航、西电和苏黎世联邦理工的联合团队找到破局关键。他们首次系统评估Qwen3的5种后训练量化技...
原文链接
阿里旗下通义千问Qwen3深夜开源,2小时内GitHub收获17k星,登顶全球开源模型榜首。Qwen3采用MoE架构,参数235B,激活仅需22B,支持混合推理模式,涵盖8款模型,从小至0.6B到大至235B,适配多种应用场景。其性能远超DeepSeek-R1、OpenAI-o1等顶级模型,尤其在数学、代码生成和多语言支持方面表现突出,参数量仅为DeepSeek-R1的1/3,但成本更低。Qwen3支持119种语言,可无缝切换思考与非思考模式,大幅降低推理成本。此外,其预训练数据达36万亿token,后训练强化学习优化显著提升了指令遵循与智能体能力。Qwen3已在魔搭、Hugging Face、GitHub等平台开源,支持免费商用。
原文链接
5月1日,《科创板日报》报道,阿里巴巴开源了新一代通义千问模型Qwen3,包含8个版本,首次推出混合推理模型,融合“快、慢思考”。Qwen3系列累计下载已达3亿次,衍生模型超10万个。小参数模型表现亮眼,32B模型性价比高,4B模型在数学能力上令人惊喜。尽管235B版本在部分测评中接近或略优于DeepSeek R1,但未达全面碾压效果。Qwen3发布后,多家芯片厂商如英伟达、英特尔、AMD等迅速适配,国产芯片海光信息已完成全部8款模型的适配优化。阿里云预计,千问3将助力智能体Agent和大模型应用爆发,今年或成AI应用元年。通用Agent在工程和技术上仍有挑战,阿里云CTO周靖人表示,未来将在类人思考、多模态及云体系结合上持续优化。
原文链接
Qwen3真香!通义App满血接入,一手实测在此
开源大模型新王者Qwen3备受关注。从预告发布到深夜上线,全球最强开源模型的消息迅速引爆全网。
Qwen3参数量覆盖0.6B到235B,支持多种语言和推理模式,性能超越多款主流模型。通义App和网页版同步上线,提供专属智能体体验。
实测显示,Qwen3生成速度快,逻辑推理能力强,代码能力优秀,尤其在空间感和复杂任务处理上表现突出。同时支持多语言翻译,甚至能创作歌曲和辅助购物比价。
开发者社区反响热烈,Reddit等平台讨论热度攀升,体现了国产大模型的全球影响力。开源协议和持续更新让Qwen系列成为开发者首选。
访问tongyi.com体验全新功能,探索更多可能!
原文链接
阿里巴巴开源Qwen3模型,数势科技SwiftAgent已完成全面适配并发布测评报告。报告对比了Qwen3与Deepseek-R1在数据分析Agent上的表现,涉及上下文改写、任务编排、数据查询、图表生成及总结反思五大方面。结果显示,Qwen3在多数环节效果优于Qwen2.5及Deepseek-R1,尤其在上下文改写和任务编排上有显著提升。同时,Qwen3的部署成本大幅降低,适合消费级显卡推理,为企业提供高性价比选择。此次测评展现了Qwen3在构建数据分析和智能决策系统方面的潜力,为企业应用带来新机遇。
原文链接
阿里Qwen3问鼎开源王座!8款模型全面开放,最大杯全方位超越R1
千呼万唤,Qwen3终于来了!一口气上新8大模型,全部开源。旗舰模型Qwen3-235B-A22B全方位超越R1、o1、o3-mini,最大杯稠密模型达32B参数量。小尺寸模型Qwen3-4B在数学、代码能力上媲美大10倍模型。...
原文链接
加载更多

暂无内容