1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
苹果AI新进展:Qwen3已全面“登陆”苹果MLX框架
苹果AI新进展:Qwen3全面适配苹果MLX框架 2024年6月16日,阿里巴巴Qwen团队宣布推出支持苹果MLX架构的Qwen3模型,包含4种精度,用户可根据硬件资源选择合适版本。搭载苹果芯片的设备可在本地更流畅、高效地运行这款中国开源大模型。 看似简单的工程优化,实则意义深远。今年2月,...
新智燎原
06-17 18:38:23
AI适配
Qwen3
苹果MLX
分享至
打开微信扫一扫
内容投诉
生成图片
为 Apple Intelligence 入华铺路?阿里巴巴发布适配苹果 MLX 架构的 Qwen3 升级版
6月17日消息,阿里巴巴推出Qwen3人工智能模型的新版本,已适配苹果MLX架构。这可能为苹果智能(Apple Intelligence)在中国市场的推出铺平道路。目前,苹果智能虽已在iOS 18.4支持简体中文,但生成式AI功能尚未在中国大陆上线。此前有传闻称苹果曾考虑与字节跳动和百度合作,最终选择阿里巴巴。此次升级的Qwen3可在搭载苹果自研芯片(Apple Silicon)的Mac电脑神经引擎及iPhone、iPad上运行。阿里巴巴于2025年4月首次发布Qwen3,采用混合架构,支持119种语言和方言,具备混合推理能力。苹果同日发布了iOS 18.6首个开发者测试版。
AI创想团
06-17 08:18:58
Apple Intelligence
Qwen3
阿里巴巴
分享至
打开微信扫一扫
内容投诉
生成图片
阿里开源 Qwen3 新模型 Embedding 及 Reranker,带来强大多语言、跨语言支持
6月6日凌晨,阿里开源了Qwen3-Embedding系列模型(包括Embedding及Reranker),专为文本表征、检索与排序任务设计。该系列基于Qwen3基础模型训练,在多项基准测试中表现卓越。8B参数规模的Embedding模型在MTEB多语言Leaderboard榜单中得分70.58,位居第一(截至2025年6月6日)。Qwen3-Embedding支持0.6B到8B参数的三种配置,具备灵活架构与多语言支持,覆盖超100种语言,且支持代码检索。Embedding模型通过“EOS”标记生成语义表示,Reranker则计算文本对相关性得分。模型还支持表征维度自定义与指令适配优化。开源地址包括ModelScope、Hugging Face及GitHub。
智慧棱镜
06-06 09:22:06
Qwen3-Embedding
多语言支持
阿里开源
分享至
打开微信扫一扫
内容投诉
生成图片
Qwen3家族训练秘籍公开:思考/非思考融进一个模型,大模型蒸馏带动小模型
Qwen3家族训练秘籍公开:思考/非思考融进一个模型,大模型蒸馏带动小模型 克雷西 | 发自凹非寺 量子位 | 公众号 QbitAI Qwen3技术报告新鲜出炉,8款模型背后的关键技术被揭晓! - 采用双模式架构,一个模型同时支持推理和非推理任务,自动切换。 - 训练和微调分段式策略,逐步构...
AI思维矩阵
05-14 16:17:10
Qwen3
双模态
模型蒸馏
分享至
打开微信扫一扫
内容投诉
生成图片
首次系统评估Qwen3在量化下的鲁棒性:8bit下仍保持近乎无损性能
标题:首次系统评估Qwen3在量化下的鲁棒性:8bit下仍保持近乎无损性能 北航联合团队投稿,量子位公众号发布 Qwen3刷新开源模型SOTA,但如何在资源受限场景中实现低比特量化且性能不掉线?来自北航、西电和苏黎世联邦理工的联合团队找到破局关键。他们首次系统评估Qwen3的5种后训练量化技...
数据炼金师
05-09 16:51:28
Qwen3
低比特量化
量化鲁棒性
分享至
打开微信扫一扫
内容投诉
生成图片
深夜突袭,阿里Qwen3登顶全球开源王座!暴击DeepSeek-R1,2小时狂揽17k星
阿里旗下通义千问Qwen3深夜开源,2小时内GitHub收获17k星,登顶全球开源模型榜首。Qwen3采用MoE架构,参数235B,激活仅需22B,支持混合推理模式,涵盖8款模型,从小至0.6B到大至235B,适配多种应用场景。其性能远超DeepSeek-R1、OpenAI-o1等顶级模型,尤其在数学、代码生成和多语言支持方面表现突出,参数量仅为DeepSeek-R1的1/3,但成本更低。Qwen3支持119种语言,可无缝切换思考与非思考模式,大幅降低推理成本。此外,其预训练数据达36万亿token,后训练强化学习优化显著提升了指令遵循与智能体能力。Qwen3已在魔搭、Hugging Face、GitHub等平台开源,支持免费商用。
智能视野
05-05 09:42:37
Qwen3
开源模型
混合推理
分享至
打开微信扫一扫
内容投诉
生成图片
登顶开源大模型榜首 阿里Qwen3成色如何?|聚焦
5月1日,《科创板日报》报道,阿里巴巴开源了新一代通义千问模型Qwen3,包含8个版本,首次推出混合推理模型,融合“快、慢思考”。Qwen3系列累计下载已达3亿次,衍生模型超10万个。小参数模型表现亮眼,32B模型性价比高,4B模型在数学能力上令人惊喜。尽管235B版本在部分测评中接近或略优于DeepSeek R1,但未达全面碾压效果。Qwen3发布后,多家芯片厂商如英伟达、英特尔、AMD等迅速适配,国产芯片海光信息已完成全部8款模型的适配优化。阿里云预计,千问3将助力智能体Agent和大模型应用爆发,今年或成AI应用元年。通用Agent在工程和技术上仍有挑战,阿里云CTO周靖人表示,未来将在类人思考、多模态及云体系结合上持续优化。
量子思考者
05-01 20:35:17
AI应用
Qwen3
开源大模型
分享至
打开微信扫一扫
内容投诉
生成图片
Qwen3真香!通义App满血接入,一手实测在此
Qwen3真香!通义App满血接入,一手实测在此 开源大模型新王者Qwen3备受关注。从预告发布到深夜上线,全球最强开源模型的消息迅速引爆全网。 Qwen3参数量覆盖0.6B到235B,支持多种语言和推理模式,性能超越多款主流模型。通义App和网页版同步上线,提供专属智能体体验。 实测显示,Qwen3生成速度快,逻辑推理能力强,代码能力优秀,尤其在空间感和复杂任务处理上表现突出。同时支持多语言翻译,甚至能创作歌曲和辅助购物比价。 开发者社区反响热烈,Reddit等平台讨论热度攀升,体现了国产大模型的全球影响力。开源协议和持续更新让Qwen系列成为开发者首选。 访问tongyi.com体验全新功能,探索更多可能!
超频思维站
04-30 19:02:05
Qwen3
开源模型
通义App
分享至
打开微信扫一扫
内容投诉
生成图片
全网首测!Qwen3 vs Deepseek-R1数据分析哪家强?
阿里巴巴开源Qwen3模型,数势科技SwiftAgent已完成全面适配并发布测评报告。报告对比了Qwen3与Deepseek-R1在数据分析Agent上的表现,涉及上下文改写、任务编排、数据查询、图表生成及总结反思五大方面。结果显示,Qwen3在多数环节效果优于Qwen2.5及Deepseek-R1,尤其在上下文改写和任务编排上有显著提升。同时,Qwen3的部署成本大幅降低,适合消费级显卡推理,为企业提供高性价比选择。此次测评展现了Qwen3在构建数据分析和智能决策系统方面的潜力,为企业应用带来新机遇。
数据炼金师
04-30 19:01:00
DeepSeek-R1
Qwen3
数据分析
分享至
打开微信扫一扫
内容投诉
生成图片
阿里Qwen3问鼎开源王座!8款模型全面开放,最大杯全方位超越R1
阿里Qwen3问鼎开源王座!8款模型全面开放,最大杯全方位超越R1 千呼万唤,Qwen3终于来了!一口气上新8大模型,全部开源。旗舰模型Qwen3-235B-A22B全方位超越R1、o1、o3-mini,最大杯稠密模型达32B参数量。小尺寸模型Qwen3-4B在数学、代码能力上媲美大10倍模型。...
蝶舞CyberSwirl
04-30 18:54:08
Qwen3
开源
模型
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序