
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
7月11日晚间,阿里通义千问推出Qwen Chat更新,新增桌面端支持一键唤起MCP并直接调用,同时网页端首页可直接开启对话。此次更新强化了多项功能,包括深入研究、图像生成、网页开发、深度思考和搜索等,进一步提升了用户体验。这一升级展示了阿里在人工智能领域的持续创新能力,为用户提供了更便捷、高效的交互方式。
原文链接
标题:拯救P图废柴,阿里上新多模态模型Qwen-VLo!人人免费可玩
昨夜,阿里推出全新多模态模型Qwen-VLo,引发网友热议。该模型在图像生成和编辑方面表现出色,具备三大亮点:增强的细节捕捉能力、一句话即可完成图像编辑(如风格替换、素材增删、添加文字),以及支持中英等多语言。同时,Qwen-...
原文链接
2025年6月27日,阿里云通义千问宣布推出多模态模型Qwen VLo,实现从感知到生成的跨越。该模型支持动态分辨率生成,可灵活应对不同场景的图像需求,并通过从左到右、从上到下的渐进式生成方式提升创作体验。Qwen VLo具备精准内容理解与再创造能力,能保持语义一致性,同时支持开放指令编辑和多语言交互,满足用户多样化需求。目前仍处于预览阶段,开发团队将持续优化。
原文链接
苹果AI新进展:Qwen3全面适配苹果MLX框架
2024年6月16日,阿里巴巴Qwen团队宣布推出支持苹果MLX架构的Qwen3模型,包含4种精度,用户可根据硬件资源选择合适版本。搭载苹果芯片的设备可在本地更流畅、高效地运行这款中国开源大模型。
看似简单的工程优化,实则意义深远。今年2月,...
原文链接
6月17日消息,阿里巴巴推出Qwen3人工智能模型的新版本,已适配苹果MLX架构。这可能为苹果智能(Apple Intelligence)在中国市场的推出铺平道路。目前,苹果智能虽已在iOS 18.4支持简体中文,但生成式AI功能尚未在中国大陆上线。此前有传闻称苹果曾考虑与字节跳动和百度合作,最终选择阿里巴巴。此次升级的Qwen3可在搭载苹果自研芯片(Apple Silicon)的Mac电脑神经引擎及iPhone、iPad上运行。阿里巴巴于2025年4月首次发布Qwen3,采用混合架构,支持119种语言和方言,具备混合推理能力。苹果同日发布了iOS 18.6首个开发者测试版。
原文链接
6月6日凌晨,阿里开源了Qwen3-Embedding系列模型(包括Embedding及Reranker),专为文本表征、检索与排序任务设计。该系列基于Qwen3基础模型训练,在多项基准测试中表现卓越。8B参数规模的Embedding模型在MTEB多语言Leaderboard榜单中得分70.58,位居第一(截至2025年6月6日)。Qwen3-Embedding支持0.6B到8B参数的三种配置,具备灵活架构与多语言支持,覆盖超100种语言,且支持代码检索。Embedding模型通过“EOS”标记生成语义表示,Reranker则计算文本对相关性得分。模型还支持表征维度自定义与指令适配优化。开源地址包括ModelScope、Hugging Face及GitHub。
原文链接
5月29日,苹果与杜克大学合作提出AI新方法——交错推理(Interleaved Reasoning),旨在提升大语言模型的推理能力。传统大语言模型在解决复杂问题时常因‘先思考后回答’模式导致响应慢且易出错。苹果团队通过引入交错推理技术,使模型边推理边输出中间答案,大幅提高了效率与准确性。实验显示,在Qwen2.5模型上,响应速度提升了80%,准确率提高19.3%。此方法仅基于问答和逻辑数据集训练,却在MATH、GPQA、MMLU等更难的任务中展现出色泛化能力。研究还探索了多种奖励机制,发现条件性和时间折扣奖励效果最优,显著优于常规方法。这项技术有望改善AI实时交互体验。
原文链接
标题:虚假奖励竟能提升Qwen性能25%!
即使使用错误的奖励信号,Qwen的性能也能显著提升?华盛顿大学的博士生团队发现,使用Qwen模型(尤其是数学版本),对虚假奖励进行强化学习(RLVR),依然能让MATH-500的准确率提高约25%。团队实验表明,RLVR通过激活预训练中的推理能力提升性能,...
原文链接
5月26日,阿里通义千问团队发布QwenLong-L1-32B模型,这是首个通过强化学习训练的长文本推理AI模型。该模型在七个DocQA基准测试中表现优异,与顶级模型相当。QwenLong-L1-32B的最大特点是上下文窗口支持高达131072个tokens,采用GRPO和DAPO算法及混合奖励函数提升推理能力。团队通过监督微调和课程引导的分阶段强化学习技术优化模型。此外,阿里还推出一套完整的长文本推理解决方案,包括高性能模型、优化数据集、创新训练方法及评估体系。
原文链接
Qwen3家族训练秘籍公开:思考/非思考融进一个模型,大模型蒸馏带动小模型
克雷西 | 发自凹非寺
量子位 | 公众号 QbitAI
Qwen3技术报告新鲜出炉,8款模型背后的关键技术被揭晓!
- 采用双模式架构,一个模型同时支持推理和非推理任务,自动切换。
- 训练和微调分段式策略,逐步构...
原文链接
加载更多

暂无内容